[发明专利]一种卡证识别方法、装置、电子设备及存储介质有效

专利信息
申请号: 202110210167.0 申请日: 2021-02-24
公开(公告)号: CN113111882B 公开(公告)日: 2022-12-20
发明(设计)人: 张霞;梁宇海;颜鑫;王闫若显;任多 申请(专利权)人: 北京邮电大学
主分类号: G06V30/148 分类号: G06V30/148;G06V30/19;G06V10/82;G06N3/04;G06N3/08
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 郑朝然
地址: 100876 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 识别 方法 装置 电子设备 存储 介质
【权利要求书】:

1.一种卡证识别方法,其特征在于,包括:

对卡证图片进行光学字符识别分析,得到卡证短文本数据;

将所述卡证短文本数据输入训练好的卡证识别模型,得到卡证类别信息;

其中,所述训练好的卡证识别模型是根据携带卡证类别标签的卡证短文本样本数据训练得到的;

其中,对卡证图片进行光学字符识别分析,得到卡证短文本数据的步骤,具体包括:

对所述卡证图片进行字符检测,得到各个字符的区域坐标信息;

根据所述区域坐标信息进行字符的区域特征提取,得到各个字符的区域特征向量;

根据字符识别算法对所述各个字符的区域特征向量进行分类识别,得到各个字符信息;

根据各个所述字符信息及其对应区域坐标信息,得到卡证短文本数据;

其中,所述训练好的卡证识别模型的训练方法具体如下:

利用预训练好的word2vec模型对短文本进行向量化处理,得到文本词向量矩阵;

将每个卡证短文本样本数据对应的文本样本词矩阵和卡证类别标签作为一个训练样本,获取多个训练样本;

将所述文本词向量矩阵输入到神经网络模型中,对文本词向量矩阵进行卷积操作,采用网络设定卷积核数量为1024,卷积核感受野高度为[2,3,4],各种卷积核卷积后得到尺寸为[32,99,1024]、[32,98,1024]、[32,97,1024]的张量;

在得到卷积结果后,利用1-max-pooling进行池化操作,得到3个尺寸为[32,1024]的矩阵向量;

对3个矩阵向量进行横向拼接,得到一个尺寸大小为[32,3072]的矩阵向量,再输入到全连接层,进行dropout,并对最终结果进行softmax函数处理,得到一个概率分布矩阵,其中,所述概率分布矩阵代表该卡证图片在各个类别上的概率大小;

利用预设损失函数根据所述概率分布矩阵和所述训练样本中的卡证类别标签计算损失值;

若所述损失值小于预设阈值,则停止训练,得到训练好的卡证识别模型;

将训练好的TextCNN模型进行保存,最终得到训练好的卡证识别模型。

2.根据权利要求1所述卡证识别方法,其特征在于,根据各个所述字符信息及其对应区域坐标信息,得到卡证短文本数据的步骤,具体包括:

将所述字符信息按照从左到右、从上到下的坐标顺序拼接,得到卡证短文本数据。

3.根据权利要求1所述卡证识别方法,其特征在于,在所述对所述卡证图片进行字符检测的步骤之前,所述方法还包括:

获取原始卡证图片;

对所述原始卡证图片进行图像二值化处理、图像噪声去除和图像倾斜校正处理,得到预处理后的卡证图片。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110210167.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top