[发明专利]一种基于阅卷系统的图片内容自动标记方法及系统有效
申请号: | 201811588082.0 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109740473B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 涂旭平;郑兆清;李岳华 | 申请(专利权)人: | 东莞市七宝树教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 佛山览众深联知识产权代理事务所(普通合伙) 44435 | 代理人: | 刘先珍 |
地址: | 523000 广东省东莞市松山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阅卷 系统 图片 内容 自动 标记 方法 | ||
本发明涉及图像处理技术领域,具体公开了一种基于阅卷系统的图片内容自动标记方法及系统,阅卷系统用于将各个题目的答案部分从原始试卷扫描图片中分离出来,并获取与题目对应的参考答案字符串进行标注;本地缓存图片器用于把标注的图片按照一定格式保存;自动标注子系统SDK自动将本地缓存图片器图片批量上传至自动标标注系统后台;自动标标注系统后台用于调用图片集合。本发明通过把答案部分从原来试卷中切出,建立起印刷体图片、手写体图片及参考答案字符串的关系,再经过人工判断答案内容,可以在不增加任何其他人工开销的情况下,同时实现试卷批改和将切出的碎片图片标注上了内容,方便快捷,便用于神经网络训练。
技术领域
本发明涉及图像处理技术领域,具体公开了一种基于阅卷系统的图片内容自动标记方法及系统。
背景技术
现在存在大量的线上试卷批改系统,这些试卷批改系统的运作模式是将试卷扫描上传到系统中,通过比较参考答案和学生的做题答案是否一致进行判断对错,最终记录得分。这种方式改卷效率十分低,而且容易出错。
随着人工智能图像处理技术的持续发展,学生试卷的自动批改变得越来越紧迫,而要实现自动批改需要进行模型的训练,一般的做法是构造一些文字,字母,数字,公式打印在一张纸上,找到一定数量的志愿者来抄写。然后将这些写好的纸张收集起来再扫描或者拍摄,再用程序再切图,最后进行归类标记。因为受限于人数有限,用来抄写的场景也有限,导致人工构造训练数据样本规模难以提高,也难以构造出样本的多样性,整个过程异常繁杂而且效果不好。
因此,需要一种能解决上述问题的方法。
发明内容
为了克服现有技术中存在的缺点和不足,本发明的目的在于提供一种基于阅卷系统的图片内容自动标记方法及系统。
为实现上述目的,本发明采用如下方案。
一种基于阅卷系统的图片内容自动标记方法,包括:
将纸质试卷扫描成试卷图片上传至阅卷系统;
通过阅卷系统获取试卷扫描图片,将各个题目的答案部分从原始试卷扫描图片中分离出来;
对分离出来答案部分的图片切割成子图,其中子图包括印刷体图片和手写体图片,将各个印刷体图片依次记为h1、h2、h3…hi,将手写体图片依次对应记为c1、c2、c3…cn;
识别各个印刷体图片的内容,从阅卷系统数据库中读出与其对应题目的参考答案字符串,并标注于对应的印刷体图片上;
将每个题目的参考答案与其对应的手写体图片以同一页面呈现给试卷批改者核对两者是否相等;
若相等,则将手写体图片标注为参考答案字符串,保存本地缓存图片目录;若不相等,则系统自动判断能否识别手写体图片内容,若能识别出则将手写体图片标注相应的内容并保存本地缓存图片目录,若不能识别出则放弃标注;
定时将本地缓存图片上传至服务器,通过调用图片集合进行神经网络训练。
进一步地,所述将各个题目的答案部分从原始试卷扫描图片中分离出来,包括:
对获取到的扫描试卷图片进行矫正处理及二值化处理;
利用试卷的信息获取答案部分所在的区域位置,将答案信息绑定试卷ID中;
根据答案部分所在的区域位置搜索,并进行切图分离出各个题目的答案部分。
进一步地,还包括接收上传的本地缓存图片后对图片进行预处理分类,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市七宝树教育科技有限公司,未经东莞市七宝树教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811588082.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防闭眼的拍照方法
- 下一篇:插队人员动态识别机构以及相应终端