[发明专利]一种基于深度学习的字符比对方法和比对系统在审
| 申请号: | 201910266072.3 | 申请日: | 2019-04-03 |
| 公开(公告)号: | CN109978072A | 公开(公告)日: | 2019-07-05 |
| 发明(设计)人: | 胥志伟;石志君;张瑜;王胜科;王亚平;吕昕 | 申请(专利权)人: | 青岛伴星智能科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 贾文健 |
| 地址: | 266000 山东省青岛市*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 字符块 特征向量 比对 图纸 实物 比对系统 学习 神经网络特征 相似性度量 人力资源 人工的 查找 | ||
1.一种基于深度学习的字符比对方法,其特征在于,包括以下步骤:
获取图纸字符块和实物字符块的特征向量;
计算图纸字符块特征向量和实物字符块特征向量之间的距离值;
根据图纸字符块特征向量和实物字符块特征向量的距离值,获得字符块相似性结果。
2.如权利要求1所述的一种基于深度学习的字符比对方法,其特征在于,所述获取图纸字符块和实物字符块的特征向量的步骤,包括:调用预先训练好的特征向量提取模型,对输入的图纸字符块图像或者实物字符块图像进行处理。
3.如权利要求1所述的一种基于深度学习的字符比对方法,其特征在于,所述计算图纸字符块特征向量和实物字符块特征向量之间的距离值的步骤,包括:计算图纸字符块特征向量和实物字符块特征向量之间的欧式距离和余弦距离,并将欧式距离和余弦距离按照权重比例拟合,获得最终的距离值。
4.如权利要求1所述的一种基于深度学习的字符比对方法,其特征在于,还包括预处理步骤,预处理步骤包括:对需要比对的图纸字符块和实物字符块进行预处理,字符块尺度缩放统一为标准输入网络的像素尺度,特殊字符块进行二值化处理,预处理完毕后进行特征向量的提取。
5.一种基于深度学习的字符比对系统,其特征在于,调用预先训练好的孪生网络模型进行相似性度量,孪生网络模型包括特征向量提取模块和相似性度量模块;
特征向量提取模块用于获取图纸字符块特征向量和实物字符块特征向量;
相似性度量模块用于计算图纸字符块特征向量和实物字符块特征向量之间的距离值;
还包括阈值判断模块,阈值判断模块用于根据图纸字符块特征向量和实物字符块特征向量的距离值,获得字符块相似性结果。
6.如权利要求5所述的一种基于深度学习的字符比对系统,其特征在于,所述特征向量提取模块为双输入模块,输入实物字符块图像和图纸字符块图像的图片对,孪生网络模型在训练过程中需要同时满足实物字符块图像和图纸字符块图像的特征提取效果要求。
7.如权利要求5所述的一种基于深度学习的字符比对系统,其特征在于,所述相似性度量模块包括欧式距离计算单元、余弦距离计算单元和联合单元;
欧式距离计算单元通过欧式距离公式计算图纸字符块特征向量和实物字符块特征向量之间的欧式距离;
余弦距离计算单元通过余弦距离公式计算图纸字符块特征向量和实物字符块特征向量之间的余弦距离;
联合单元通过联合公式将欧式距离和余弦距离按照权重比例拟合成最终的距离值。
8.如权利要求5所述的一种基于深度学习的字符比对系统,其特征在于,所述孪生网络模型的训练过程包括:首先,搭建初始的孪生网络模型;然后,通过训练集训练孪生网络模型的参数,训练集包括匹配无错误的字符对和不匹配有刻印错误的字符对,还包括匹配与不匹配的标签,每隔设定次数的训练步骤,在验证集上计算每个字符对是否判断正确,然后计算总的精确度;当精确度达到设定阈值则停止训练孪生网络模型,如果达到设定的训练总次数后,精确度依然没达到预设的要求,则调整最初的孪生网络模型网络搭建层数,重新训练。
9.如权利要求5所述的一种基于深度学习的字符比对系统,其特征在于,还包括预处理模块,预处理模块首先对需要比对的字符块进行预处理,尺度缩放统一为标准输入网络的像素尺度,特殊字符块需要进行二值化处理,预处理完毕后的字符块输入特征向量提取模块。
10.如权利要求5所述的一种基于深度学习的字符比对系统,其特征在于,所述特征向量提取模块包括:实物字符块图像或者图纸字符块图像输入到特征向量提取模块后,依次经过64×64、32×32、16×16、8×8、1×1的降采样卷积层,得到多维特征矩阵,随后进行上采样操作过程,上采样操作过程包括依次经过8×8、16×16、32×32、64×64、1×1的5层上采样卷积层和4个合并层,5层上采样卷积层和4个合并层交替相接;合并层是对上一层卷积层输出的特征矩阵与同大小的降采样卷积层得到的结果做一个多维矩阵元素加和,然后在保持特征矩阵第三维大小的基础上将1、2维通道扩充为原来的二倍,然后再输入下一层的上采样卷积层;最终得到64×64的特征矩阵,然后拉长为特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛伴星智能科技有限公司,未经青岛伴星智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910266072.3/1.html,转载请声明来源钻瓜专利网。





