[发明专利]基于深度学习的确认OCR识别结果可靠性的方法及介质有效
申请号: | 201910160850.0 | 申请日: | 2019-03-04 |
公开(公告)号: | CN109919076B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 郝占龙;林玉玲;陈文传;杜保发 | 申请(专利权)人: | 厦门商集网络科技有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 福州科扬专利事务所(普通合伙) 35001 | 代理人: | 何小星 |
地址: | 361101 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 确认 ocr 识别 结果 可靠性 方法 介质 | ||
1.一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于:包括如下步骤:
将OCR识别得到的票据影像按设定的字段进行分割,生成多个字段碎片图像,同时生成各所述字段碎片图像在所述票据影像上的坐标信息;所述设定的字段是根据票据类型需要从票据上提取的需要核验的关键信息;
对各所述字段碎片图像进行单字分割,生成单字图像和单字图像在所述票据影像上的坐标信息;建立每个单字图像与所述票据影像的映射关系;
通过深度学习模型对所述单字图像进行特征提取,将单字图像转换为单字的第一特征矩阵;
根据所述单字图像的坐标信息从标准库中提取OCR识别结果中该坐标位置对应的单字的标准特征矩阵,逐个计算所述单字的第一特征矩阵与对应的标准特征矩阵的相似度,若计算结果在设定的相似度阈值范围内,则认为该单字识别正确,否则认为该单字识别错误;
所述字段碎片图像的单字分割,生成单字图像的步骤具体为:将所述字段碎片图像通过深度学习模型进行特征提取,转换为字段碎片图像的特征矩阵,通过窗口截取字段碎片图像特征矩阵,得到单字的第二特征矩阵,根据该第二特征矩阵在字段碎片图像特征矩阵中的位置,确定该第二特征矩阵对应的单字坐标信息,根据该单字坐标信息从所述字段碎片图像中分割出单字图像。
2.根据权利要求1所述的一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于:采用不同尺度且宽高比例为1:1的窗口分别遍历截取字段碎片图像的特征矩阵,和/或采用不同尺度且宽高比例为1:2的窗口分别遍历截取字段碎片图像的特征矩阵。
3.根据权利要求2所述的一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于:将所述窗口截取到的特征矩阵输入所述深度学习模型进行判断,所述深度学习模型通过预设的置信度阈值进行筛选,输出目标特征矩阵。
4.根据权利要求3所述的一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于:所述目标特征矩阵通过非极大值抑制合并重复的区域,得到单字的第二特征矩阵,同时根据该第二特征矩阵在字段碎片图像特征矩阵中的位置,确定该第二特征矩阵对应的单字坐标信息,根据该单字坐标信息从所述字段碎片图像中分割出单字图像。
5.根据权利要求1所述的一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于,核验出该单字识别错误,根据该单字图像的坐标信息定位该单字图像在所述票据影像中的位置,并提示用户。
6.根据权利要求1所述的一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于,所述相似度计算的方式包括欧氏距离,余弦距离或马氏距离。
7.根据权利要求1所述的一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于,所述深度学习模型的损失函数引入余弦距离和角度距离,其公式为:其中,m是每批次处理样本的总数量,s是xi的二范数,即s=||xi||,是第i个属于类别yi的样本的深度特征,d是特征维度,θyi代表yi类别样本的角向量,θj代表j类别样本的角向量,n是类别数量。
8.根据权利要求1所述的一种基于深度学习的确认OCR识别结果可靠性的方法,其特征在于,所述深度学习模型的损失函数公式为:其中,m是每批次处理样本的总数量,是WT的第yi列,是WT的第j列,byi是第yi列的偏置,bj是第j列的偏置,是第i个属于类别yi的样本的深度特征,d是特征维度,是最后全连接层权重W的第j列,n是类别数量,T表示矩阵的转置。
9.一种计算机可读存储介质,其上存储有指令,其特征在于,该指令被处理器加载时执行如权利要求1所述的基于深度学习的确认OCR识别结果可靠性的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门商集网络科技有限责任公司,未经厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910160850.0/1.html,转载请声明来源钻瓜专利网。