图像处理与模式识别课程大作业
图像处理与模式识别代写 每个班同学分为 5 组,每组选择一个专题,每人独立完成。若同学选择国内开源框架,可以 2-3 人组团完成一个专题。下列各个专题的开源项目只是简单的列出,建议同学在网上与 gitee、github 上自行搜索其它开源项目,鼓励组团使用国内自主可控的开源框架。
作业分为 robomaster 比赛大小符识别与深度学习综合实践两部分。
一、综合大作业:Robomaster 以往比赛大小符识别 (60 分)
1、作业目的
充分利用所学各种图像处理技术,实现对图像的综合处理,巩固同学对基础知识的理解和应用,提高大家的代码编写调试能力。
2、作业内容
ROBOMASTER 机甲大师赛是国内首个激战类机器人竞技比赛,参赛队伍需自行研制多种类型的机 器人进行协同作战。在 2018 年比赛的能量机关激活环节,也称大小神符环节,全向移动步兵射击机 器人通过读取地上固定的 RFID 卡,激活其正前方的触摸屏屏幕。触摸屏屏幕上方为数码管密码显示区域,下方为九宫格手写数字或火焰字显示区域,具体见图 1。机器人在本体的固定位置上安装有识别摄像头,以第一视角获取前方图像。比赛时,机器人需要通过摄像头先识别数码管区域的 5 个密码数字,然后控制射击机构依照顺序用塑料子弹击打九宫格区域内对应的数字。九宫格区域内的手写数字每隔固定时间更新一次,每次只有一个手写数字与数码管密码区内的某个数字一致。步兵射击机器人只有正确识别两类数字,并按照数码管数字顺序连续 5 次成功击打九宫格内的手写数字,才算成功完成这项任务。比赛在室内场馆进行,光照强度适中,分布相对均匀,但也有一定的明暗变化。显然,击打大小符的首要任务是各类数字的定位与识别。
选大符或者小符图片,如图 2,实现图片的数码管分割,九宫格分割,以及数码管数字和九宫格数字的识别。可以选用 opencv、matlab、python+opencv、pytorch 等工具。同时,提供大小符的数据集,同学可以用数据集训练算法。
3、参考方法
分割识别实现过程
(1)先转化为 HSV 图像(小符可以不需用)
(2)基于彩色进行图像分割
(3)进行形态学处理
(4)通过轮廓函数找出所有轮廓
(5)根据面积大小筛选出数码管图片轮廓
(6)在原图上对筛选出的数码管进行分割,根据最小包围矩阵中点求出对应数码管数字坐标
(7)用穿线法、最近邻法、支持向量机、cnn 等方法中的一种,识别分割出的数码管图片数字,建议使用穿线法,程序简单,原理容易理解
(8)分割出九宫格区域
(9)根据九宫格数字图片大小将数字分割,根据最小包围矩阵中点求出对应九宫格数字坐标
(10)用最近邻法、支持向量机、cnn 等方法中的一种,识别出九宫格中分割出的图片数字提供训练数据集,数据集可以根据自己需要处理,所提供方法仅作参考,其它方法也能实现功能。穿线法与最近邻法、支持向量机、cnn 等机器学习方法需要自己查阅相关资料进行一定程度的自学。
4、opencv 相关参考函数
(1)cvtColor、inRange、findContours、threshold 见前面实验
(2)boundingRect 函数
功能:计算并返回指定点集最外面的矩形边界调用格式:Rect boundingRect(InputArray points)唯一的参数为输入的二维点集,可以是 std::vector 或 Mat 类型
(3)minAreaRect 函数
功能:此函数用于对给定的 2D 点集,寻找可旋转的最小面积的包围矩阵调用格式:RotatedRect minAreaRect(InputArray points)其中唯一的一个参数为输入的二维点集,可以为 std::vector 或 Mat 类型
二、深度学习综合实践(40 分) 图像处理与模式识别代写
1、作业目的
充分利用网上的开源资源,熟悉 pytorch、tensorflow、paddlepaddle、mindspore 等深度学习框架中的一类,或者用 MATLAB 的深度学习工具箱(资源相对较少),掌握深度学习在图像与计算机视觉的各类应用的使用方法。
2、作业内容
注意:每个班同学分为 5 组,每组选择一个专题,每人独立完成。若同学选择国内开源框架,可以 2-3 人组团完成一个专题。下列各个专题的开源项目只是简单的列出,建议同学在网上与 gitee、github 上自行搜索其它开源项目,鼓励组团使用国内自主可控的开源框架。如果希望不仅仅是使用预训练模型,自己需要训练模型又受算力的限制,可考虑使用申请网上免费框架及提供的算力支持。
(1)安全帽识别
https://gitee.com/jason921121/Smart_Construction
https://github.com/njvisionpower/Safety-Helmet-Wearing-Dataset
(2)口罩识别
https://github.com/njvisionpower/Safety-Helmet-Wearing-Dataset
https://github.com/AIZOOTech/FaceMaskDetection
(3)人体姿态检测
https://github.com/open-mmlab/mmpose
https://github.com/yysijie/openpose
https://github.com/hrnet/
(4)自然场景文字识别(OCR)
https://github.com/open-mmlab/mmocr
https://www.paddlepaddle.org.cn/modelbase
(5)生活物品识别(目标检测)
https://www.paddlepaddle.org.cn/modelbase
https://blog.csdn.net/Never__Say__No/article/details/109851320
(6)其它同学提出通过审核的专题
相关网页:
港科大开源工具: https://github.com/open-mmlab
华为 MindSpore: https://www.mindspore.cn/
百度的 PaddlePaddle :https://www.paddlepaddle.org.cn/
https://gitee.com/
https://github.com
bilibili 上相关视频课程:例如 pytorch 深度学习,
三、作业要求
(1)大符小符识别为基础部分,深度学习实践为提高部分,鼓励组团使用国内自主可控的开源深度学习、机器学习框架。
(2)如果使用百度、华为等国内开源框架,可以 2-3 人组队完成大作业,各负责一部分;
(3)大作业包括报告、程序实现两部分。报告包括所选专题的相关介绍与发展现状,所用方法原理介绍、程序流程、算法代码、运行结果分析,报告中列出参考文献、参考开源项目。程序实现部分最好在最后一次实验或答疑时给教师演示。
(4)交作业时,报告部分需打印上交。同时,作业报告电子档、参考文献电子档、程序代码文件、所参考的开源代码一起打包在网上雨课堂上上交,超过 100M 内容邮件发我。
(5)作业最终上交时间,7 月 5 日
四、说明 图像处理与模式识别代写
本专业同学的软件编程能力,亟需增强。此作业即是对图像处理的综合应用,也是提升大家的编程能力,同时让同学对深度学习在计算机视觉中的应用有所体会。编程及训练时,一定注意相关调试工具的使用及算力的支持。
商科代写 cs代写 法律学代写 经济学代考_经济学作业代写 艺术代写 心理学代写 哲学代写 伦理学代写 体育学代写 化学代写 教育学代写 医学代写 历史代写
发表回复
要发表评论,您必须先登录。