[发明专利]汉字字形相似度计算方法及其系统有效
申请号: | 201610729187.8 | 申请日: | 2016-08-26 |
公开(公告)号: | CN106407179B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 刘德建;张安民;严冠裕;魏仁海;钟良德;郭玉湖 | 申请(专利权)人: | 福建网龙计算机网络信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62 |
代理公司: | 福州市博深专利事务所(普通合伙) 35214 | 代理人: | 林志峥 |
地址: | 350000 福建省福州市马尾*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种汉字字形相似度计算方法及其系统,方法包括:预设得到由各字形结构之间的相似度构成的第一相似度矩阵;计算任意两个基础部件的相似度,得到第二相似度矩阵;根据字形的构造方法,预设同级部件的第一权重比;获取目标汉字和比较汉字;生成目标汉字对应的第一前缀表达式;生成比较汉字对应的第二前缀表达式;根据第一相似度矩阵,确定两个前缀表达式和中同级字形结构的相似度;根据第二相似度矩阵,确定两个前缀表达式中同级基础部件的相似度;确定第一前缀表达式中各组同级部件的第一权重比;计算获取目标汉字和比较汉字的相似度。可直观地体现出汉字的部件组成和构造,便于理解,且可提高计算效率和计算结果的准确性。 | ||
搜索关键词: | 汉字 字形 相似 计算方法 及其 系统 | ||
【主权项】:
1.一种汉字字形相似度计算方法,其特征在于,包括:预设任意两个字形结构的相似度,得到由各字形结构之间的相似度构成的第一相似度矩阵;计算任意两个基础部件的相似度,得到第二相似度矩阵;根据字形的构造方法,预设同级部件的第一权重比;获取目标汉字和比较汉字;根据所述目标汉字的字形结构和组成所述目标汉字的基础部件,生成对应的第一前缀表达式;根据所述比较汉字的字形结构和组成所述比较汉字的基础部件,生成对应的第二前缀表达式;根据第一相似度矩阵,确定所述第一前缀表达式和第二前缀表达式中同级字形结构的相似度;根据第二相似度矩阵,确定所述第一前缀表达式和第二前缀表达式中同级基础部件的相似度;根据目标汉字字形的构造方法,确定所述第一前缀表达式中与各级字形结构一一对应的各组同级部件的第一权重比;根据所述同级字形结构的相似度、同级基础部件的相似度和各组同级部件的第一权重比,计算获取所述目标汉字和比较汉字的相似度;所述“计算任意两个基础部件的相似度”具体为:获取任意两个基础部件;将所述两个基础部件分别转换为两个图像;分别将所述两个图像进行灰度化处理,获取所述两个图像各个像素的灰度值;根据所述各个像素的灰度值,分别计算所述两个图像的平均灰度值;分别根据所述平均灰度值,将所述两个图像进行二值化处理,得到由黑点和白点构成的所述两个基础部件的指纹序列;计算两个指纹序列中的黑点重合度占比,得到所述两个基础部件的指纹相似度,所述黑点重合度占比为两个指纹序列中位置一致的黑点数占两个指纹序列的黑点数中较大的黑点数的百分比;分别获取所述两个基础部件的笔画笔顺和四角码;根据两个基础部件的四角码,得到所述两个基础部件的四角码相似度;根据两个基础部件的笔画笔顺,计算编辑距离占两个基础部件的笔画数中较大的笔画数的百分比,得到所述两个基础部件的笔画笔顺不相似度;根据所述笔画笔顺不相似度,计算得到所述两个基础部件的笔画笔顺相似度;根据所述两个基础部件的类型,预设所述指纹相似度、四角码相似度和笔画笔顺相似度的第二权重比;根据所述指纹相似度、四角码相似度、笔画笔顺相似度和第二权重比,计算得到所述两个基础部件的相似度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建网龙计算机网络信息技术有限公司,未经福建网龙计算机网络信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610729187.8/,转载请声明来源钻瓜专利网。