[发明专利]基于深度学习的智能阅卷定位方法在审
申请号: | 201910168207.2 | 申请日: | 2019-03-06 |
公开(公告)号: | CN109948609A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 桂冠;邵蕾;李懋阳;刘超;熊健;杨洁;孙颖异;孟洋 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;张赏 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于深度学习的智能阅卷定位方法,以口算题定位为例,方法包括,用手机拍摄若干张口算题图片,并将其分为训练集和测试集;利用labelImg标注工具,用Bounding Box标记出训练集中每张图片上口算题的位置;然后生成xml文件,将xml文件转换成txt文件;对YOLOv3算法进行修改,在分类中加入小学生口算题的类别,并且对数据集进行训练;训练完成后保存权重,对测试集中的图片进行测试,回归出每张图片中每个口算题的Bounding Box,实现小学生口算题的定位。本发明能够实现对图片中若干口算题的定位功能,而且测试结果的准确性较高,从而可以降低了人工阅卷的工作量。 | ||
搜索关键词: | 阅卷 图片 小学生 测试 定位功能 手机拍摄 智能 测试集 数据集 训练集 权重 算法 上口 标注 张口 工作量 学习 保存 转换 分类 回归 | ||
【主权项】:
1.基于深度学习的智能阅卷定位方法,其特征在于,包括以下步骤:1)创建数据集,具体过程如下:11)通过拍摄的方式获取若干张试题的jpg格式图片,其中,每张试题图片中包含若干个试题,将试题图片分为训练集和测试集;12)采用labelImg标注工具对训练集中每张试题图片使用Bounding Box进行标注,标记出每张试题图片中每个试题的具体位置;13)完成标注后,将jpg格式的图片生成xml格式的文件;14)将xml格式的文件转化为txt格式的标签文件,每个标签文件里面储存该图片中每个试题边界框的五个数值;所述五个数值中第一个值表示该试题图片的类别编号,第二个值表示归一化后的边界框的中心点x坐标,第三个值表示归一化后的边界框的中心点y坐标,第四个值表示归一化后的边界框宽度,第五个值表示归一化后的边界框的高度,所述边界框是指包含该试题的Bounding Box标注的方框;2)采用基于深度学习的YOLOv3算法对每个试题进行定位,具体过程如下:21)对每个试题的边界框进行预测;22)对所预测的边界框采用多标签分类法进行分类,分为0和1两类,表示0的边界框在图片中去掉,保留代表1的边界框;23)采用YOLOv3算法预测三种不同尺度的box;24)构建Darknet‑53网络,进行特征提取;3)将训练集放入Darknet‑53网络中进行训练,输出每个试题的定位,训练完成以后自动生成权重文件;4)对测试集中的图片进行测试,输出测试图片上每个试题精准定位的Bounding Box。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910168207.2/,转载请声明来源钻瓜专利网。