[发明专利]一种基于阅卷系统的图片内容自动标记方法及系统有效
申请号: | 201811588082.0 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109740473B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 涂旭平;郑兆清;李岳华 | 申请(专利权)人: | 东莞市七宝树教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 佛山览众深联知识产权代理事务所(普通合伙) 44435 | 代理人: | 刘先珍 |
地址: | 523000 广东省东莞市松山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阅卷 系统 图片 内容 自动 标记 方法 | ||
1.一种基于阅卷系统的图片内容自动标记方法,其特征在于,包括:
将纸质试卷扫描成试卷图片上传至阅卷系统;
通过阅卷系统获取试卷扫描图片,将各个题目的答案部分从原始试卷扫描图片中分离出来;
对分离出来答案部分的图片切割成子图,其中子图包括印刷体图片和手写体图片,将各个印刷体图片依次记为h1、h2、h3…hi,将手写体图片依次对应记为c1、c2、c3…cn;将所述印刷体图片与所述手写体图片建立对应关系;
识别各个印刷体图片的内容,从阅卷系统数据库中读出与其对应题目的参考答案字符串,并标注于对应的印刷体图片上,建立所述印刷体图片、所述手写体图片及所述参考答案字符串的关系;
阅卷系统先自动识别所述手写体图片的内容,若可以识别出来,则自动改卷,核对手写体图片内容与参考答案字符串是否正确,若阅卷系统能判断是否正确,则不传给人工改卷;若不能判断是否正确,则传给人工改卷,将每个题目的参考答案与其对应的手写体图片以同一页面呈现给试卷批改者核对两者是否相等;
若相等,则将手写体图片标注为参考答案字符串,保存本地缓存图片目录;若不相等,则系统自动判断能否识别手写体图片内容,若能识别出则将手写体图片标注相应的内容并保存本地缓存图片目录,若不能识别出则放弃标注;
定时将本地缓存图片上传至服务器,通过调用图片集合进行神经网络训练;
接收上传的本地缓存图片后对图片进行预处理分类,具体为:
根据被标注图片的信息内容定义被标注图片的种类,所述被标注图片的种类包括字母类、数字类、汉字类、公式类及几何形状类;
对被标注图片的种类进行类型编码,并在后台进行注释说明;若上述被标注图片的种类可再进行子类划分,则在类型编码时增加子类型编码;
将手写体图片和印刷体图片按定义的种类作进一步划分,根据阅卷系统中题目的参考答案字符串的存储格式,判断参考答案字符串的类型,并标注对应的类型编码。
2.根据权利要求1所述的一种基于阅卷系统的图片内容自动标记方法,其特征在于,所述将各个题目的答案部分从原始试卷扫描图片中分离出来,包括:
对获取到的扫描试卷图片进行矫正处理及二值化处理;
利用试卷的信息获取答案部分所在的区域位置,将答案信息绑定试卷ID中;
根据答案部分所在的区域位置搜索,并进行切图分离出各个题目的答案部分。
3.根据权利要求1所述的一种基于阅卷系统的图片内容自动标记方法,其特征在于,所述参考答案字符串的存储格式包括latex格式和html格式。
4.根据权利要求3所述的一种基于阅卷系统的图片内容自动标记方法,其特征在于,还包括:对本地缓存图片文件名保存为type-time-random.jpg,其中type表示图片内容的类型,time表示当前时间,random是一个为了防止重复的32位10进制整数;并对应保存一文档label-type-time-random.txt,内容为被标注的答案字符串。
5.根据权利要求3所述的一种基于阅卷系统的图片内容自动标记方法,其特征在于,还包括将编程接口进行封装集成到不同的阅卷系统中,以下载接口的方式获取不同阅卷系统的标注图片。
6.根据权利要求5所述的一种基于阅卷系统的图片内容自动标记方法,其特征在于,下载接口的方式包括:
通过接口查询某个类型的图片集合列表,其中查询需提供查询账号和查询的图片对应的类型编码信息;
获取图片集合列表,从图片集合列表获取相应的图片集ID、图片集大小、图片集中图片张数及声明的MD5值,所述MD5值用于校验图片集是否有被改动;
选定图片集ID进行下载,并通过MD5算法计算出下载的图片集的MD5值,将其与声明的MD5值进行比较,若相同则说明没有被改变,若不相同则被改变,需重新下载图片集。
7.一种基于阅卷系统的图片内容自动标记的系统,其特征在于,包括:本地缓存图片器,阅卷系统和自动标注系统后台;
所述阅卷系统用于将各个题目的答案部分从原始试卷扫描图片中分离出来,并获取与题目对应的参考答案字符串进行标注,具体通过以下方式实现:阅卷系统获取试卷扫描图片,将各个题目的答案部分从原始试卷扫描图片中分离出来;对分离出来答案部分的图片切割成子图,其中子图包括印刷体图片和手写体图片,将各个印刷体图片依次记为h1、h2、h3…hi,将手写体图片依次对应记为c1、c2、c3…cn;将所述印刷体图片与所述手写体图片建立对应关系;
识别各个印刷体图片的内容,从阅卷系统数据库中读出与其对应题目的参考答案字符串,并标注于对应的印刷体图片上,建立所述印刷体图片、所述手写体图片及所述参考答案字符串的关系;
阅卷系统先自动识别所述手写体图片的内容,若可以识别出来,则自动改卷,核对手写体图片内容与参考答案字符串是否正确,若阅卷系统能判断是否正确,则不传给人工改卷;若不能判断是否正确,则传给人工改卷,将每个题目的参考答案与其对应的手写体图片以同一页面呈现给试卷批改者核对两者是否相等;
若相等,则将手写体图片标注为参考答案字符串,保存本地缓存图片目录;若不相等,则系统自动判断能否识别手写体图片内容,若能识别出则将手写体图片标注相应的内容并保存本地缓存图片目录,若不能识别出则放弃标注;
所述阅卷系统包括自动标注子系统SDK,自动标注子系统SDK自动将本地缓存图片器图片批量上传至自动标标注系统后台;所述自动标标注系统后台用于调用图片集合,方便进行神经网络训练;
所述本地缓存图片器用于把标注的图片按照一定格式保存,本地缓存图片文件名保存为type-time-random.jpg,其中type表示图片内容的类型,time表示当前时间,random是一个为了防止重复的32位10进制整数;并对应保存一文档Iabel-type-time-random.txt,内容为被标注的答案字符串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市七宝树教育科技有限公司,未经东莞市七宝树教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811588082.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防闭眼的拍照方法
- 下一篇:插队人员动态识别机构以及相应终端