[发明专利]基于文本匹配的学生作业页码识别方法有效
| 申请号: | 201910800669.1 | 申请日: | 2019-08-28 |
| 公开(公告)号: | CN110533035B | 公开(公告)日: | 2022-02-15 |
| 发明(设计)人: | 张东祥;聂雨杨;郭馨茹;陈李江 | 申请(专利权)人: | 海南阿凡题科技有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/764;G06V10/82;G06K9/62;G06F16/31;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 571924 海南省海口市老城高*** | 国省代码: | 海南;46 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文本 匹配 学生 作业 页码 识别 方法 | ||
1.一种基于文本匹配的学生作业页码识别方法,其特征在于,该页码识别方法包括:
步骤S10,获取纸质文本页面的图像作为待识别页面;
步骤S20,识别所述待识别页面中的各个文字连通域,根据所识别出来的文字连通域,对文字内容进行划分,获得多个文本行图片;
步骤S30,通过文本序列识别模型,分别基于所述多个文本行图片转化为相应的文本,获得待识别页面对应的文本;所述文本序列识别模型基于深度学习神经网络构建,包括图像理解模型、序列生成模型;所述图像理解模型基于稠密卷积神经网络构建,其结构为:顺次连接的输入层、设定卷积核的卷积层、设定核的最大池化层、第一稠密模块、第一过渡模块、第二稠密模块、第二过渡模块、第三稠密模块、第三过渡模块、第四稠密模块、第四过渡模块、输出层;
步骤S40,提取所述待识别页面对应的文本的bi-gram与tri-gram特征,获得特征集合;
步骤S50,分别在倒排表中查询所述特征集合中每一个特征,获取共同特征最多的图片;所述倒排表根据数据库图片对应的bi-gram与tri-gram特征构建;
步骤S60,判断所述共同特征最多的图片包含的共同特征数量是否大于设定阈值,是则该图片为所述待识别页面的匹配图片,该图片对应的页码数字类别为所述待识别页面的页码数字类别;否则数据库中不包含所述待识别页面的匹配图片。
2.根据权利要求1所述的基于文本匹配的学生作业页码识别方法,其特征在于,所述第一稠密模块、第二稠密模块、第三稠密模块、第四稠密模块分别包括设定数量的稠密层。
3.根据权利要求2所述的基于文本匹配的学生作业页码识别方法,其特征在于,所述稠密层,其结构为:
顺次连接的层归一化操作层、设定卷积核的卷积操作层、设定核的瓶颈层。
4.根据权利要求1所述的基于文本匹配的学生作业页码识别方法,其特征在于,所述第一过渡模块、第二过渡模块、第三过渡模块、第四过渡模块分别包括设定数量的过渡层。
5.根据权利要求4所述的基于文本匹配的学生作业页码识别方法,其特征在于,所述过渡层,其结构为:
顺次连接的设定卷积核的卷积操作层、设定核的平均池化层。
6.一种基于文本匹配的学生作业页码识别系统,其特征在于,该页码识别系统包括输入模块、文字行划分模块、文本序列识别模块、特征提取模块、特征匹配模块、页面匹配模块、输出模块;
所述输入模块,配置为获取纸质文本页面的图像作为待识别页面;
所述文字行划分模块,配置为识别所述待识别页面中的各个文字连通域,根据所识别出来的文字连通域,对文字内容进行划分,获得多个文本行图片;
所述文本序列识别模块,配置为通过文本序列识别模型,分别基于所述多个文本行图片转化为相应的文本,获得待识别页面对应的文本;所述文本序列识别模型基于深度学习神经网络构建,包括图像理解模型、序列生成模型;所述图像理解模型基于稠密卷积神经网络构建,其结构为:顺次连接的输入层、设定卷积核的卷积层、设定核的最大池化层、第一稠密模块、第一过渡模块、第二稠密模块、第二过渡模块、第三稠密模块、第三过渡模块、第四稠密模块、第四过渡模块、输出层;
所述特征提取模块,配置为提取所述待识别页面对应的文本的bi-gram与tri-gram特征,获得特征集合;
所述特征匹配模块,配置为分别在倒排表中查询所述特征集合中每一个特征,获取共同特征最多的图片;所述倒排表根据数据库图片对应的bi-gram与tri-gram特征构建;
所述页面匹配模块,配置为判断所述共同特征最多的图片包含的共同特征数量是否大于设定阈值,是则该图片为所述待识别页面的匹配图片,该图片对应的页码数字类别为所述待识别页面的页码数字类别;否则数据库中不包含所述待识别页面的匹配图片;
所述输出模块,配置为输出页面匹配结果。
7.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载并执行以实现权利要求1-5任一项所述的基于文本匹配的学生作业页码识别方法。
8.一种处理装置,包括
处理器,适于执行各条程序;以及
存储装置,适于存储多条程序;
其特征在于,所述程序适于由处理器加载并执行以实现:
权利要求1-5任一项所述的基于文本匹配的学生作业页码识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南阿凡题科技有限公司,未经海南阿凡题科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910800669.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车前脸品牌分类方法
- 下一篇:一种票据扫描图像快速倾斜校正方法和系统





