[发明专利]一种卡证识别方法、装置、电子设备及存储介质有效
申请号: | 202110210167.0 | 申请日: | 2021-02-24 |
公开(公告)号: | CN113111882B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 张霞;梁宇海;颜鑫;王闫若显;任多 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 电子设备 存储 介质 | ||
1.一种卡证识别方法,其特征在于,包括:
对卡证图片进行光学字符识别分析,得到卡证短文本数据;
将所述卡证短文本数据输入训练好的卡证识别模型,得到卡证类别信息;
其中,所述训练好的卡证识别模型是根据携带卡证类别标签的卡证短文本样本数据训练得到的;
其中,对卡证图片进行光学字符识别分析,得到卡证短文本数据的步骤,具体包括:
对所述卡证图片进行字符检测,得到各个字符的区域坐标信息;
根据所述区域坐标信息进行字符的区域特征提取,得到各个字符的区域特征向量;
根据字符识别算法对所述各个字符的区域特征向量进行分类识别,得到各个字符信息;
根据各个所述字符信息及其对应区域坐标信息,得到卡证短文本数据;
其中,所述训练好的卡证识别模型的训练方法具体如下:
利用预训练好的word2vec模型对短文本进行向量化处理,得到文本词向量矩阵;
将每个卡证短文本样本数据对应的文本样本词矩阵和卡证类别标签作为一个训练样本,获取多个训练样本;
将所述文本词向量矩阵输入到神经网络模型中,对文本词向量矩阵进行卷积操作,采用网络设定卷积核数量为1024,卷积核感受野高度为[2,3,4],各种卷积核卷积后得到尺寸为[32,99,1024]、[32,98,1024]、[32,97,1024]的张量;
在得到卷积结果后,利用1-max-pooling进行池化操作,得到3个尺寸为[32,1024]的矩阵向量;
对3个矩阵向量进行横向拼接,得到一个尺寸大小为[32,3072]的矩阵向量,再输入到全连接层,进行dropout,并对最终结果进行softmax函数处理,得到一个概率分布矩阵,其中,所述概率分布矩阵代表该卡证图片在各个类别上的概率大小;
利用预设损失函数根据所述概率分布矩阵和所述训练样本中的卡证类别标签计算损失值;
若所述损失值小于预设阈值,则停止训练,得到训练好的卡证识别模型;
将训练好的TextCNN模型进行保存,最终得到训练好的卡证识别模型。
2.根据权利要求1所述卡证识别方法,其特征在于,根据各个所述字符信息及其对应区域坐标信息,得到卡证短文本数据的步骤,具体包括:
将所述字符信息按照从左到右、从上到下的坐标顺序拼接,得到卡证短文本数据。
3.根据权利要求1所述卡证识别方法,其特征在于,在所述对所述卡证图片进行字符检测的步骤之前,所述方法还包括:
获取原始卡证图片;
对所述原始卡证图片进行图像二值化处理、图像噪声去除和图像倾斜校正处理,得到预处理后的卡证图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110210167.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:净水器滤芯抗菌性能测试方法
- 下一篇:一种基于时分多址的多时隙功率分配方法