[发明专利]一种基于深度学习的票证关键信息提取方法和装置在审

申请号：	202110295682.3	申请日：	2021-03-19
公开（公告）号：	CN113065423A	公开（公告）日：	2021-07-02
发明（设计）人：	张宾;孙喜民;周晶;刘丹;王帅;李慧超	申请（专利权）人：	国网电子商务有限公司;国网电商科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06N3/04;G06N3/08
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	陈志海
地址：	100053 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习票证关键信息提取方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种基于深度学习的票证关键信息提取方法和装置，将待审核图像输入至预先构建的目标检测网络中，经由目标检测网络对待审核图像进行目标检测，得到各个文本框图像、以及各个文本框图像的类别。对各个文本框图像进行文字识别，得到文本框图像与文字信息之间的对应关系。基于类别与审核项之间的预设对应关系、以及文本框图像与文字信息之间的对应关系，确定审核项所对应的文字信息。相较于现有技术，本申请所述方法无需对识别得到的各个文字信息进行规则匹配，避免因规则匹配所导致的误差，从而有效提升文字识别的准确性。

技术领域

本申请涉及图像识别技术领域，尤其涉及一种基于深度学习的票证关键信息提取方法和装置。

背景技术

对待审核图像进行文字识别，一直是图像识别技术中的关注重点。所谓的待审核图像，即人们日常生活工作中所接触的票证(例如身份证、发票、缴费清单、以及火车票等)的图像。对待审核图像进行文字识别，其实就是提取票证中的关键信息。

在现有技术中，大多利用文字识别技术，识别待审核图像所示的各个文字信息，并对各个文字信息进行规则匹配，确定各个预设的审核项(即票证中关键信息的类型)所对应的文字信息，以身份证图像为例，预设的审核项可以为身份证号码、家庭住址和出生年月等。然而，规则匹配的匹配结果较为容易出错，使得待审核图像的文字识别的准确性降低。

发明内容

本申请提供了一种基于深度学习的票证关键信息提取方法和装置，目的在于提高文字识别的准确性。

为了实现上述目的，本申请提供了以下技术方案：

一种基于深度学习的票证关键信息提取方法，包括：

将待审核图像输入至预先构建的目标检测网络中，经由所述目标检测网络对所述待审核图像进行目标检测，得到各个文本框图像、以及各个所述文本框图像的类别；

对各个所述文本框图像进行文字识别，得到所述文本框图像与文字信息之间的对应关系；

基于所述类别与审核项之间的预设对应关系、以及所述文本框图像与文字信息之间的对应关系，确定所述审核项所对应的文字信息；

其中，所述目标检测网络对所述待审核图像进行目标检测的过程为：

利用预设的锚框修正结构，修正所述目标检测网络的锚框，使得所述锚框的旋转角度与所述待审核图像所示文字的旋转角度之间的差值，不大于预设阈值；

利用预设的特征金字塔网络，对所述待审核图像进行特征提取，得到各个特征图；

针对每个所述特征图，在所述特征图上使用所述锚框生成多个边框，并对各个所述边框进行后处理，得到每个所述特征图的文本框图像；

利用预设的分类器，识别各个所述文本框图像的类别。