[发明专利]基于文本匹配的学生作业页码识别方法有效
| 申请号: | 201910800669.1 | 申请日: | 2019-08-28 |
| 公开(公告)号: | CN110533035B | 公开(公告)日: | 2022-02-15 |
| 发明(设计)人: | 张东祥;聂雨杨;郭馨茹;陈李江 | 申请(专利权)人: | 海南阿凡题科技有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/764;G06V10/82;G06K9/62;G06F16/31;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 571924 海南省海口市老城高*** | 国省代码: | 海南;46 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文本 匹配 学生 作业 页码 识别 方法 | ||
本发明属于图像匹配技术领域,具体涉及了一种基于文本匹配的学生作业页码识别方法,旨在解决现有技术页码识别精确度达不到预期并且拓展性不强的问题。本发明方法包括:识别待识别页面的文字连通区域并进行划分,获得多个文本行图片;通过文本序列识别模型分别将文本行图片转化为文本;提取文本的N‑gram特征,并在数据库对应的特征倒排表中查询;将数据库中共同特征最多且特征数量高于设定阈值的图片作为文本的匹配图片。本发明使用基于深度学习神经网络构建的文本序列识别模型,通过N‑gram特征查询的方式,从数据库中匹配图片,页面匹配和页码识别精确度有了很大的提高,对于数学公式等不规则字符的识别精确率提升也有很好的效果。
技术领域
本发明属于图像匹配技术领域,具体涉及了一种基于文本匹配的学生作业页码识别方法。
背景技术
页码识别,其关键在于页码印刷体数字的识别。基于模版匹配的数字识别方法:主要问题是计算量大,并且,如果模版与需要识别的数字字体相差较大则无法识别,对模版的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感。基于特征分析的方法:通过提取号码图像中的具有代表性的特征达到识别该数字的目的,当前研究中的数字特征主要有:焦点特征、封闭半封闭特征、横竖直线特征、投影特征以及分区面积特征等等,但是这些特征鲁棒性不够,受数字字体、倾斜度等因素影响程度不一,直接影响到实际应用中数字识别的准确率。基于页面信息匹配去识别页码的方法,需要根据预设的锚点区域及其对应的文本区域,生成图片识别模板;锚点区域与所述文本区域存在位置对应关系,所述文本区域包括定义了文本含义的文本信息。该方法的优点是根据预设的信息可以比较快捷的识别图片中的文本,但是使用该方法需要预先生成模板,故拓展性不强。
总的来说,现有技术对于页码识别的精确度达不到预期,并且其方法的拓展性不强。
发明内容
为了解决现有技术中的上述问题,即现有技术页码识别精确度达不到预期并且拓展性不强的问题,本发明提供了一种基于文本匹配的学生作业页码识别方法,该页面匹配方法包括:
步骤S10,获取纸质文本页面的图像作为待识别页面;
步骤S20,识别所述待识别页面中的各个文字连通域,根据所识别出来的文字连通域,对文字内容进行划分,获得多个文本行图片;
步骤S30,通过文本序列识别模型,分别基于所述多个文本行图片转化为相应的文本,获得待识别页面对应的文本;所述文本序列识别模型基于深度学习神经网络构建,包括图像理解模型、序列生成模型;
步骤S40,提取所述待识别页面对应的文本的bi-gram与tri-gram特征,获得特征集合;
步骤S50,分别在倒排表中查询所述特征集合中每一个特征,获取共同特征最多的图片;所述倒排表为根据数据库图片对应的bi-gram与tri-gram特征构建的;
步骤S60,判断所述共同特征最多的图片包含的共同特征数量是否大于设定阈值,是则该图片为所述待识别页面的匹配图片,该图片对应的页码数字类别为所述待识别页面的页码数字类别;否则数据库中不包含所述待识别页面的匹配图片。
在一些优选的实施例中,所述图像理解模型基于稠密卷积神经网络构建,其结构为:
顺次连接的输入层、设定卷积核的卷积层、设定核的最大池化层、第一稠密模块、第一过渡模块、第二稠密模块、第二过渡模块、第三稠密模块、第三过渡模块、第四稠密模块、第四过渡模块、输出层。
在一些优选的实施例中,所述第一稠密模块、第二稠密模块、第三稠密模块、第四稠密模块分别包括设定数量的稠密层。
在一些优选的实施例中,所述稠密层,其结构为:
顺次连接的层归一化操作层、设定卷积核的卷积操作层、设定核的瓶颈层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南阿凡题科技有限公司,未经海南阿凡题科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910800669.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车前脸品牌分类方法
- 下一篇:一种票据扫描图像快速倾斜校正方法和系统





