[发明专利]一种卡证识别方法、装置、电子设备及存储介质有效
申请号: | 202110210167.0 | 申请日: | 2021-02-24 |
公开(公告)号: | CN113111882B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 张霞;梁宇海;颜鑫;王闫若显;任多 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 电子设备 存储 介质 | ||
本发明提供一种卡证识别方法、装置、电子设备及存储介质,该方法包括:对卡证图片进行光学字符识别分析,得到卡证短文本数据;将所述卡证短文本数据输入训练好的卡证识别模型,得到卡证类别信息;其中,所述训练好的卡证识别模型是根据携带卡证类别标签的卡证短文本样本数据训练得到的。本申请使用OCR技术,对上传的卡证图片集进行文字及其坐标提取,把提取到的文字进行拼接,形成短文本数据集,并通过训练好的卡证识别模型进行推理,取概率值最大的类别作为该卡证图片的识别类别。该方法高效、准确,有效地补充了该领域的实现方案。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种卡证识别方法、装置、电子设备及存储介质。
背景技术
随着无纸化办公的发展,人们通过拍照上传卡片证件进行办理业务越来越普及。这要求处理多种业务的复杂系统必须具备识别分类卡证图片的能力。
在现有的技术中,通常直接对卡证图片进行分类,由于图片容易受明暗、角度、噪声、色彩等等因素的影响,识别困难。而且准确率高的深度学习模型往往因计算复杂度高导致推理低效。
因此如何更好的实现卡证类别的识别,已经成为业界亟待解决的问题。
发明内容
本发明提供及一种卡证识别方法、装置、电子设备及存储介质,用以解决现有技术中无法很好的实现卡证类别的识别的问题。
本发明提供一种卡证识别方法,包括:
对卡证图片进行光学字符识别分析,得到卡证短文本数据;
将所述卡证短文本数据输入训练好的卡证识别模型,得到卡证类别信息;
其中,所述训练好的卡证识别模型是根据携带卡证类别标签的卡证短文本样本数据训练得到的。
根据本发明提供的一种卡证识别方法,对卡证图片进行光学字符识别分析,得到卡证短文本数据的步骤,具体包括:
对所述卡证图片进行字符检测,得到各个字符的区域坐标信息;
根据所述区域坐标信息进行字符的区域特征提取,得到各个字符的区域特征向量;
根据字符识别算法对所述各个字符的区域特征向量进行分类识别,得到各个字符信息;
根据各个所述字符信息及其对应区域坐标信息,得到卡证短文本数据。
根据本发明提供的一种卡证识别方法,在将所述卡证短文本数据输入训练好的卡证识别模型,得到卡证类别信息的步骤之前,所述方法还包括:
获取各个卡证短文本样本数据和各个卡证短文本样本数据对应的卡证类别标签;
将每个卡证短文本样本数据进行文本向量化处理,得到文本样本词矩阵;
将每个卡证短文本样本数据对应的文本样本词矩阵和卡证类别标签作为一个训练样本;
获取多个训练样本,利用多个训练样本对预设神经网络进行训练。
根据本发明提供的一种卡证识别方法,所述利用多个训练样本对预设神经网络进行训练的步骤,具体包括:
对于任意一个训练样本,将所述训练样本输入预设神经网络,输出所述训练样本对应的分类概率;
利用预设损失函数根据所述训练样本对应的分类概率和所述训练样本中的卡证类别标签计算损失值;
若所述损失值小于预设阈值,则停止训练,得到训练好的卡证识别模型。
根据本发明提供的一种卡证识别方法,根据各个所述字符信息及其对应区域坐标信息,得到卡证短文本数据的步骤,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110210167.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:净水器滤芯抗菌性能测试方法
- 下一篇:一种基于时分多址的多时隙功率分配方法