首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]从身份证影像图片中提取关键信息的方法与系统在审

申请号：	202110266439.9	申请日：	2021-03-11
公开（公告）号：	CN112949523A	公开（公告）日：	2021-06-11
发明（设计）人：	陈俊奇;张建;陈章辉;尤毅;齐轶;邵修齐;丁益斌;杨静	申请（专利权）人：	兴业银行股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32;G06N3/04
代理公司：	上海段和段律师事务所 31334	代理人：	李佳俊;郭国中
地址：	350000 ***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	身份证影像图片提取关键信息方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种从身份证影像图片中提取关键信息的方法，其特征在于，包括：

图片识别步骤：通过卷积神经网络对图片进行分类，识别得到身份证图片；

人脸检测步骤：通过人脸检测模型检测身份证图片，得到头像面的身份证图片，并对头像面的身份证图片进行旋转，直至匹配出正向头像，获取头像的位置坐标并基于头像的位置坐标获取身份证头像面截图；

国徽检测步骤：通过国徽检测模型检测身份证图片，得到国徽面的身份证图片，并对国徽面的身份证图片进行旋转，直至匹配出正向国徽，获取国徽的位置坐标并基于国徽的位置坐标获取身份证国徽面截图；

底纹去除步骤：对身份证头像面截图和身份证国徽面截图进行去除底纹；

文本框检测步骤：对去除底纹后的身份证头像面截图和身份证国徽面截图进行文本框识别，得到文本框截图；

文字识别步骤：对文本框截图进行文字识别，得到识别结果，对识别结果进行校准，得到最终识别结果。

2.根据权利要求1所述的从身份证影像图片中提取关键信息的方法，其特征在于，所述底纹去除步骤包括：

构建对抗神经网络模型，采用对抗神经网络模型中的生成网络生成无底纹图像，并采用对抗神经网络模型中的辨别网络参照真实无底纹图像来分辨生成的无底纹图像与真实无底纹图像。

3.根据权利要求1所述的从身份证影像图片中提取关键信息的方法，其特征在于，所述文本框检测步骤包括使用预训练的CTPN模型进行文本框检测，并对检测有误的文本框截图进行标注，包括：

获取文本框截图有误的文本框截图；

通过图像形态学中的膨胀腐蚀操作处理文本框截图，使相距相近的文字合并成为一个区域；

对得到的区域进行筛选，过滤掉面积小于预设值的区域；

使用矩形框来框定过得到的区域，得到文本框的位置坐标；

由得到的文本框的位置坐标组成训练集，对CTPN模型进行训练。

4.根据权利要求1所述的从身份证影像图片中提取关键信息的方法，其特征在于，还包括身份证号信息校正步骤：

使用n个基于不同训练集和基础网络的CRNN识别文本框截图，得到n个身份证号的识别结果；

将n个识别结果中的7至14位根据出生日期合法性进行初步纠正；

若n个识别结果中的一个识别结果能通过身份证号校验规则，则作为最终识别结果；若n个识别结果均无法通过身份证号校验规则，则统计n个识别结果中各个位置得到的识别数字，以各位置出现次数最多的数字作为对应位置的识别数字进行组合得到组合结果，若组合结果能通过身份证号校验规则，则作为最终识别结果；

将通过身份证号校验规则的文本框截图和最终识别结果作为训练集，重新训练所述的n个CRNN，并进行多轮迭代。

5.根据权利要求1所述的从身份证影像图片中提取关键信息的方法，其特征在于，还包括身份证地址信息校正步骤：

获取全国地址数据库数据；

以省份为地址树的第一个节点，分别取对应候选待匹配省份长度的地址结果，与待匹配省份进行文字视觉差异性度量，寻找差异性最低的省份，记录差异性；

在子树中继续匹配，直到叶子节点；

回溯得到整条路径，以各节点的平均差异性最低的路径作为最终识别结果；

基于最终识别结果的路径前三个节点，得到对应的发证机关信息；

所述视觉差异性度量包括：

将每个汉字生成笔画序列，比较两个汉字之间的笔画序列，若一个汉字需要改变m个笔画得到另一个汉字的笔画序列，那么这两个汉字的差异性为m。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于兴业银行股份有限公司，未经兴业银行股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110266439.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种污水处理用清理设备
下一篇：一种方便人工装卸的内物流器具子母台车

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top