[发明专利]文本图像相似度评估方法、装置、电子设备及存储介质有效
申请号: | 202110663259.4 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113255667B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京北汇律师事务所 11711 | 代理人: | 李英杰 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图像 相似 评估 方法 装置 电子设备 存储 介质 | ||
1.一种文本图像相似度评估方法,其特征在于,包括:
获取第一文本图像和第二文本图像;
分别对所述第一文本图像和所述第二文本图像进行划分处理,获取多个第一子文本图像和多个第二子文本图像;
在所述多个第一子文本图像中选择第一指定子文本图像;其中,所述第一指定子文本图像为所述多个第一子文本图像中任意的子文本图像;
在所述多个第二子文本图像中选择与所述第一指定子文本图像对应的第二指定子文本图像以及多个周围子文本图像;其中,所述多个周围子文本图像与所述第二指定子文本图像的距离小于预定阈值;
分别计算所述第一指定子文本图像与所述第二指定子文本图像、所述多个周围子文本图像的多个相似度;
根据所述多个相似度评估所述第一文本图像和第二文本图像的相似度;
根据所述多个相似度评估所述第一文本图像和第二文本图像的相似度包括:
在所述多个相似度中选择最大相似度,将所述最大相似度作为所述第一指定子文本图像与所述第二文本图像的子相似度;
根据所述多个第一子文本图像中任意子文本图像与所述第二文本图像的各个子相似度评估所述第一文本图像和所述第二文本图像的相似度;
根据所述多个第一子文本图像中任意子文本图像与所述第二文本图像的各个子相似度评估所述第一文本图像和所述第二文本图像的相似度包括:
获取所述第一文本图像的中心的预定范围;
获取第一指定子文本图像在所述预定范围的面积大小;
根据所述面积大小确定所述第一指定子文本图像与所述第二文本图像的相似度的各个权重;
根据所述各个子相似度和对应的所述各个权重评估所述第一文本图像和所述第二文本图像的相似度。
2.根据权利要求1所述的文本图像相似度评估方法,其特征在于,获取第一文本图像和第二文本图像之后,所述方法还包括:
将所述第一文本图像和第二文本图像进行缩放处理,得到大小相同的第一文本图像和第二文本图像;
将大小相同的第一文本图像和第二文本图像转换为灰度图。
3.根据权利要求1所述的文本图像相似度评估方法,其特征在于,分别计算所述第一指定子文本图像与所述第二指定子文本图像、所述多个周围子文本图像的多个相似度包括:
将所述第一指定子文本图像、所述第二指定子文本图像、所述多个周围子文本图像输入至局部文本图像相似度估计模型得到所述多个相似度;
其中,所述局部文本图像相似度估计模型通过如下步骤训练得到:
获取多个文本语句、多个打印字体以及多个背景图片;
将所述多个文本语句、所述多个打印字体以及所述多个背景图片进行组合,获得多个第一训练文本图像;
对所述第一训练文本图像进行图像增强操作,形成第二训练文本图像;其中,所述增强操作至少包括如下之一的操作:裁剪、翻转、形变、调整大小;
根据预定规则从所述第二训练文本图像选择成对的相似度样本;
计算所述成对的相似度样本的相似度;
根据所述成对的相似度样本和所述成对的相似度样本的相似度对卷积神经网络进行训练得到所述局部文本图像相似度估计模型。
4.根据权利要求3所述的文本图像相似度评估方法,其特征在于,所述卷积神经网络包括依次连接的第一组卷积块、第二组卷积块、全连接层和sigmoid层;
所述第一组卷积块包括多个卷积层,每个卷积层由卷积、归一化、Relu函数激活层组成;
所述第二组卷积块包括多个卷积层,所述第二组卷积块中的每个卷积层的卷积核大小为前一层的倍数;其中,所述倍数大于等于2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110663259.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纺织加工用线条印染装置
- 下一篇:一种快拆器械
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序