[发明专利]一种端到端税务票据文本检测与识别方法有效
申请号: | 201911220830.4 | 申请日: | 2019-12-03 |
公开(公告)号: | CN110969129B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 刘新宇;李锐;于治楼 | 申请(专利权)人: | 山东浪潮科学研究院有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/14;G06V30/148;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 郗艳荣 |
地址: | 250100 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 端到端 税务 票据 文本 检测 识别 方法 | ||
本发明特别涉及一种端到端税务票据文本检测与识别方法。该端到端税务票据文本检测与识别方法,首先采用目标检测算法粗略检测文本区域,根据税务票据文本某些文字之间间距大的特性提出边界注意力机制,细化文本区域;然后利用语义分割技术检测税务印章中的弯曲文本,同时进行文本识别。该端到端税务票据文本检测与识别方法,利用检测加分割技术既可以检测水平和多方向文本又可以检测弯曲文本,同时利用注意力机制通过迭代的方式实现了字间距大的文本实例的检测,而且实现了端到端的检测与识别,既可以提高检测与识别的准确率又可以提高整个流程的效率。
技术领域
本发明涉及深度学习中目标检测与语义分技术领域,特别涉及一种端到端税务票据文本检测与识别方法。
背景技术
近年来,由于文本检测与识别技术(OCR技术)巨大的应用前景,该项技术吸引了越来越多研究者的关注。文本检测与识别技术能够自动,快速地获取不同场景中的文本信息,为后续操作提供便利,例如手写文档录入,场景理解,自动驾驶,地理定位等诸多方面。
目前的工作基本都将检测和识别视为两个独立的任务——文本检测任务和文本识别任务。文本图片首先输入到检测模型定位出相应的文本区域,将文本区域裁剪出来输入到文本识别模型输出相应的识别结果。以往文本检测和文本识别技术使用的都是基于人工设计的特征,但随着深度学习的发展,现在大部分的文本检测和文本识别技术使用的都是深度神经网络自动学习特征。
文本检测技术大致可以分为两类。
首先是基于检测的方法,这类方法又可以细分为基于组件的方法和基于单词或文本行的方法。
(一)基于组件的方法首先检测文本的一部分(可能包含一个或多个字符),然后通过后处理的方式将这些组件分组,将同一组的组件合并,形成最终的文本。
(二)另一种方法是基于单词或文本行的方法,这类方法主要继承自一些流行的目标检测框架,例如Faster RCNN,SSD等。这类方法首先设置一些默认的文本框,通过卷积神经网络对文本框是否包含文本分类,并对文本框进行边框回归。
基于检测的方法在水平文本或多方向文本中取得了不错的表现,但是无法检测弯曲文本。
第二类是基于分割的方法,这类方法主要继承自语义分割,输入图片经过分割网络输出与原图片相同尺度的掩码图片,掩码图片每个像素的值都是0~1,表示有无文本。通过后处理的方式将像素分组,同一组的像素构成一个最终的文本区域。
基于分割的方法可以检测任意形状的文本,但是需要像素级别的标注,数据集的标注有巨大的困难。另外如何将像素分组也是目前遇到的难题,两个文本区域距离太近容易将相应的像素分到同一组中。
目前,文本识别技术主要基于编码-解码框架,在解码过程中利用各注意力机制提高识别准确率。2D attention可以用来识别弯曲文本。
虽然,现有的技术大多将文本检测和文本识别视为两个独立的任务,但是着两个任务在一定程度上是可以相辅相成的。最近虽然已经出现一些端到端的设计,但是这些模型大多数采用堆砌的策略,将检测和识别的模块堆积在一个模型里面,导致整体结构太过复杂,训练困难。另外目前流行的框架基本都是基于英文文本的,而专门用于中文的模型少之又少。
针对以上情况,本发明提出了一种端到端税务票据文本检测与识别方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的端到端税务票据文本检测与识别方法。
本发明是通过如下技术方案实现的:
一种端到端税务票据文本检测与识别方法,其特征在于:首先采用目标检测算法粗略检测文本区域,根据税务票据文本某些文字之间间距大的特性提出边界注意力机制,细化文本区域;然后利用语义分割技术检测税务印章中的弯曲文本,同时进行文本识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮科学研究院有限公司,未经山东浪潮科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911220830.4/2.html,转载请声明来源钻瓜专利网。