[发明专利]一种证件分类方法、装置及设备在审
申请号: | 202010029903.8 | 申请日: | 2020-01-13 |
公开(公告)号: | CN111242124A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 陈志军;甘宇飞 | 申请(专利权)人: | 支付宝实验室(新加坡)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 新加坡珊顿大道8号安盛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 证件 分类 方法 装置 设备 | ||
本说明书实施例提供一种证件分类方法、装置及设备。方案包括:采用分类模型对获取的证件图像进行初步识别,得到针对多种证件类型的多个置信度分数之后;对置信度分数大于第一预设分数的多个候选证件类型以及待识别证件进行二次比对,具体地,分别提取出多个候选证件类型中的标志区域和固定文字区域的多个特征向量,再提取出待识别证件中标志区域和固定文字区域的特征向量;计算第一特征向量与多个第二特征向量的相似度,在得到的多个相似度值中,将最大的相似度值对应的候选证件类型确定为待识别证件的类型。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种证件分类方法、装置及设备。
背景技术
目前,随着互联网技术的发展,网上办理业务已经越来越普遍,越来越多的业务,如通信行业、金融行业、出入境等领域都需要对用户的证件信息进行采集和登记,以进行实名制管理。在对证件进行识别认证时,首先需要对证件进行分类,但是随着科学技术与经济的发展,证件种类逐渐增多,对证件进行分类显得更加困难。
现有技术中基于传统机器学习的多类证件检测分类模型对证件进行分类,在面临日益增多的证件类型时,分类的准确率较低,已经不能满足市场的需求。
因此,需要提供一种更可靠的证件分类方案。
发明内容
有鉴于此,本说明书一个或多个实施例提供了一种证件分类方法、装置及设备,用于提高证件分类的准确率。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种证件分类方法,包括:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
本说明书实施例提供的一种证件分类装置,包括:
证件图像获取模块,用于获取待识别证件的证件图像;
识别模块,用于采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
第一候选证件类型确定模块,用于确定所述置信度分数大于第一预设分数的多个候选证件类型;
第一特征向量提取模块,用于对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
第二特征向量提取模块,用于分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
相似度计算模块,用于计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
证件类型确定模块,用于将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
本说明书实施例提供的一种证件分类设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝实验室(新加坡)有限公司,未经支付宝实验室(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010029903.8/2.html,转载请声明来源钻瓜专利网。