[发明专利]一种基于深度学习的票证关键信息提取方法和装置在审
申请号: | 202110295682.3 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113065423A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 张宾;孙喜民;周晶;刘丹;王帅;李慧超 | 申请(专利权)人: | 国网电子商务有限公司;国网电商科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈志海 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 票证 关键 信息 提取 方法 装置 | ||
本申请公开了一种基于深度学习的票证关键信息提取方法和装置,将待审核图像输入至预先构建的目标检测网络中,经由目标检测网络对待审核图像进行目标检测,得到各个文本框图像、以及各个文本框图像的类别。对各个文本框图像进行文字识别,得到文本框图像与文字信息之间的对应关系。基于类别与审核项之间的预设对应关系、以及文本框图像与文字信息之间的对应关系,确定审核项所对应的文字信息。相较于现有技术,本申请所述方法无需对识别得到的各个文字信息进行规则匹配,避免因规则匹配所导致的误差,从而有效提升文字识别的准确性。
技术领域
本申请涉及图像识别技术领域,尤其涉及一种基于深度学习的票证关键信息提取方法和装置。
背景技术
对待审核图像进行文字识别,一直是图像识别技术中的关注重点。所谓的待审核图像,即人们日常生活工作中所接触的票证(例如身份证、发票、缴费清单、以及火车票等)的图像。对待审核图像进行文字识别,其实就是提取票证中的关键信息。
在现有技术中,大多利用文字识别技术,识别待审核图像所示的各个文字信息,并对各个文字信息进行规则匹配,确定各个预设的审核项(即票证中关键信息的类型)所对应的文字信息,以身份证图像为例,预设的审核项可以为身份证号码、家庭住址和出生年月等。然而,规则匹配的匹配结果较为容易出错,使得待审核图像的文字识别的准确性降低。
发明内容
本申请提供了一种基于深度学习的票证关键信息提取方法和装置,目的在于提高文字识别的准确性。
为了实现上述目的,本申请提供了以下技术方案:
一种基于深度学习的票证关键信息提取方法,包括:
将待审核图像输入至预先构建的目标检测网络中,经由所述目标检测网络对所述待审核图像进行目标检测,得到各个文本框图像、以及各个所述文本框图像的类别;
对各个所述文本框图像进行文字识别,得到所述文本框图像与文字信息之间的对应关系;
基于所述类别与审核项之间的预设对应关系、以及所述文本框图像与文字信息之间的对应关系,确定所述审核项所对应的文字信息;
其中,所述目标检测网络对所述待审核图像进行目标检测的过程为:
利用预设的锚框修正结构,修正所述目标检测网络的锚框,使得所述锚框的旋转角度与所述待审核图像所示文字的旋转角度之间的差值,不大于预设阈值;
利用预设的特征金字塔网络,对所述待审核图像进行特征提取,得到各个特征图;
针对每个所述特征图,在所述特征图上使用所述锚框生成多个边框,并对各个所述边框进行后处理,得到每个所述特征图的文本框图像;
利用预设的分类器,识别各个所述文本框图像的类别。
可选的,所述目标检测网络的构建过程,包括:
构建训练集;其中,所述训练集包括样本图像、与所述样本图像对应的标注框、以及所述标注框的类别;
将所述样本图像输入至预设的卷积神经网络中,利用预设的损失函数和优化算法训练所述卷积神经网络,直至所述卷积神经网络输出的文本框图像与所述标注框对应、以及输出的类别与所述标注框的类别对应,确定当前训练得到的卷积神经网络为所述目标检测网络。
可选的,所述锚框修正结构包括:
多个卷积层。
可选的,所述特征金字塔网络包括:
特征提取器。
可选的,所述特征提取器包括:
多个卷积层。
可选的,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网电子商务有限公司;国网电商科技有限公司,未经国网电子商务有限公司;国网电商科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110295682.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:定位方法、装置、服务器、介质及产品
- 下一篇:一种磷污染物的去除方法及装置