[发明专利]一种基于扫描的英语作文试卷版面分析方法在审

专利信息
申请号: 202011514723.5 申请日: 2020-12-21
公开(公告)号: CN112598004A 公开(公告)日: 2021-04-02
发明(设计)人: 李哲;侯冲;陈家海;叶家鸣;吴波 申请(专利权)人: 安徽七天教育科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06N3/04;G06N3/08
代理公司: 安徽申策知识产权代理事务所(普通合伙) 34178 代理人: 程艳梅
地址: 230000 安徽省合肥市新站区铜*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 扫描 英语 作文 试卷 版面 分析 方法
【说明书】:

发明公开了一种基于扫描的英语作文试卷版面分析方法,涉及文本检测领域。针对扫描的英语作文试卷这种特殊的文档图像数据,提出了基于语义分割方法解决手写文本检测的方案。整体基于语义分割网络架构,利用Resnet‑Block(残差结构)提取手写文本特征,实现英语作文试卷前景和背景的分离,并设计了多比例特征图融合机制和特殊的图像标签预处理机制,提高了手写文本检测召回率,提高了不规则形状文本检测效果,解决了近邻文本行的易粘连难分割问题,简化了语义分割的后处理过程,提高了OCR(光学字符识别)效率。本发明主要包含以下步骤:数据预处理、网络结构设计、目标函数设计、网络输出后处理。

技术领域

本发明涉及深度学习图像语义分割领域,具体涉及到一种基于扫描的英语试卷作文版面分析方法。

背景技术

现有的基于英语作文试卷版面分析方法主要分为基于传统图像处理算法和基于深度学习方法。不同的方法都是基于提取图像中的内容特征区分手写文本区域和其他区域。

传统图像处理算法主要提取图像中几何信息,例如作文答题区域边界框,以及答题框内答题线信息来确定学生手写英语文本位置信息。通过调研和实验发现提取几何信息能够检测提取出文本位置信息,但是当扫描图片包含扫描噪声,学生涂改书写错误答案破坏答题线,作文答题线非常规几何形状的时候,传统算法并不能很好的泛化上述情况,无法有效完整提取学生答题区域。

基于深度学习方法主要分为文本行检测和文本语义分割。文本行检测能够有效检测水平竖直倾斜文本,能够有效定位学生手写文本,能够有效区分非答题机器打印文本和手写文本,但是学生答题文档与普通打印文档不同在于,学生在修改答题答案时,在空白处书写非水平文本,文本检测方法很难处理任意形状文本定位。基于文本语义分割能够有效分割手写文本区域和非手写文本区域,能够解决处理书写文本的不规则形状,但是分割方法在处理密集文本时,非常容易将多行文本融合提取,不能分割文本行相互重叠的情况,导致后处理非常复杂。

综上所述,对于英语作文试卷文本区域提取,采用现有方法并不可行。本发明将基于英语作文答题试卷上述的特性,提出一种合理高效高准确率的版面分析方法。

发明内容

本发明的目的在于:针对英语作文试卷进行版面分析,设计合理的方法,分割学生答题区域和非答题区域,提取答题区域文本,消除依赖几何信息提取文本区域,能够检测任意形状手写文本以及密集文本分割不粘连,提供一种基于扫描的英语试卷作文版面分析方法。

本发明采用的技术方案如下:

一种基于扫描的英语作文试卷版面分析方法,基于语义分割网络U-net结构设计,其主要特征在于,包含Resnet-Block特征提取部分、多尺度特征图融合部分、网络输出定义部分以及数据标签预处理部分。

其中包含Resnet-Block特征提取部分:作文图片特征提取使用U-net结构网络,图像特征提取过程维度变换如图2所示,矩形代表三维图像特征,数字表示图像通道数。其中,为了更好的捕捉图像细节特征,同时减少网络参数,卷积模块使用Resnet结构的Resnet-Block,如图3所示。

其中多尺度特征图融合部分:在图像下采样阶段分别保存原始图像尺寸的二分之一、四分之一、八分之一和十六分之一大小的特征图,在图像特征上采样的过程中分别融合不同尺度大小的特征图,使用特征通道拼接,然后使用1x1卷积进行特征融合。不同尺度的特征能够分割不同尺寸大小的文本行,尺寸较大特征图能够保留图片中较短文本行特征,比如每个段落最后一行短文本或者书信格式作文的开头落款文本;尺寸较小特征图由于拥有较大的感受野,能够保留原始图片中长文本行的图像特征;通过1x1卷积进行特征融合能够减少网络参数,融合长短文本所需图像特征,能够有效检测出英语作文图片中不同尺寸的文本行,网络结构如图4所示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽七天教育科技有限公司,未经安徽七天教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011514723.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top