[发明专利]一种证件图片处理方法及装置、介质、电子设备有效
申请号: | 201910533126.8 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110222695B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 孟冬伟;王佳军 | 申请(专利权)人: | 拉扎斯网络科技(上海)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁 |
地址: | 200333 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 证件 图片 处理 方法 装置 介质 电子设备 | ||
1.一种证件图片处理方法,其特征在于,包括: 确定证件图片中的文本框; 对所述文本框的内容进行文字识别,基于所述内容的语义特征以及空间序列信息得到文本串; 对所述文本串进行语义识别,关联所述文本串至所述证件中的条目类别; 所述方法还包括: 根据所述证件图片,获得所述证件图片的证件编号;根据所述证件编号确定证件信息; 若所述证件信息不存在,则判断所述证件图片为伪造证件图片; 若所述证件信息存在,则将所述证件信息的每一条文本串与识别出的所述文本串进行比对; 若比对结果完全一致,则判断所述证件图片为真实证件图片;若比对结果不完全一致,则判断所述证件图片为伪造证件图片。
2.根据权利要求1所述的证件图片处理方法,其特征在于,所述确定证件图片中的文本框包括: 确定所述证件图片中的文字像素以及非文字像素的分割结果; 采用并查集的方式,基于所述分割结果得到连通的文字区域; 以所述文字区域长边的像素距离作为所述文字区域的长度,得到封闭矩形; 基于所述封闭矩形得到所述文本框。
3.根据权利要求2所述的证件图片处理方法,其特征在于,确定所述证件图片中的文字像素以及非文字像素的分割结果包括: 对所述证件图片进行特征提取,得到特征图谱; 基于所述特征图谱进行特征融合; 基于特征融合的结果进行特征预测; 根据预测特征对每一个像素进行文本和非文本的分割,得到所述分割结果。
4.根据权利要求1所述的证件图片处理方法,其特征在于,对所述文本框的内容进行文字识别,得到文本串包括: 输入所述文本框的内容至卷积神经网络,获取所述文本框的内容的图像空间特征以及初步的语义特征; 输入所述图像空间特征以及所述初步的语义特征至递归神经网络,得到输出结果,输出结果包含处理后的语义特征以及空间序列信息;通过分类器对所述递归神经网络的输出结果进行分类处理,得到所述文本串。
5.根据权利要求1所述的证件图片处理方法,其特征在于,对所述文本串进行语义识别,关联所述文本串至所述证件中的条目类别包括: 采用分词模型对所述文本串进行分词; 采用编码器对分词的结果进行编码; 采用多层递归神经网络提取所述编码的语义信息; 采用分类器对所述语义信息进行分类,得到所述条目类别。
6.一种证件图片处理装置,其特征在于,包括: 文本框确定模块,用于确定证件图片中的文本框; 文字识别模块,用于对所述文本框的内容进行文字识别,基于所述内容的语义特征以及空间序列信息得到文本串; 语义识别与关联模块,用于对所述文本串进行语义识别,关联所述文本串至所述证件中的条目类别; 所述装置还用于: 根据所述证件图片,获得所述证件图片的证件编号;根据所述证件编号确定证件信息; 若所述证件信息不存在,则判断所述证件图片为伪造证件图片; 若所述证件信息存在,则将所述证件信息的每一条文本串与识别出的所述文本串进行比对; 若比对结果完全一致,则判断所述证件图片为真实证件图片;若比对结果不完全一致,则判断所述证件图片为伪造证件图片。
7.一种电子设备,其特征在于,包括至少一个存储器和至少一个处理器;所述存储器存储程序,所述处理器调用所述程序,所述程序用于: 确定证件图片中的文本框; 对所述文本框的内容进行文字识别,基于所述内容的语义特征以及空间序列信息得到文本串; 对所述文本串进行语义识别,关联所述文本串至所述证件中的条目类别; 所述程序还用于: 根据所述证件图片,获得所述证件图片的证件编号;根据所述证件编号确定证件信息; 若所述证件信息不存在,则判断所述证件图片为伪造证件图片; 若所述证件信息存在,则将所述证件信息的每一条文本串与识别出的所述文本串进行比对; 若比对结果完全一致,则判断所述证件图片为真实证件图片;若比对结果不完全一致,则判断所述证件图片为伪造证件图片。
8.根据权利要求7所述的电子设备,其特征在于,所述确定证件图片中的文本框包括:确定所述证件图片中的文字像素以及非文字像素的分割结果; 采用并查集的方式,基于所述分割结果得到连通的文字区域; 以所述文字区域长边的像素距离作为所述文字区域的长度,得到封闭矩形; 基于所述封闭矩形得到所述文本框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拉扎斯网络科技(上海)有限公司,未经拉扎斯网络科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910533126.8/1.html,转载请声明来源钻瓜专利网。