[发明专利]基于本体概念的词汇语义相似度求解方法在审
申请号: | 201610833103.5 | 申请日: | 2016-09-20 |
公开(公告)号: | CN106611038A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 本体 概念 词汇 语义 相似 求解 方法 | ||
技术领域
本发明涉及语义网络技术领域,具体涉及一种基于本体概念的词汇语义相似度求解方法。
背景技术
目前,很多学者在关注本体概念相似度的计算方法,相似度问题在哲学、语义学等多个学科中被深入的研究和分析。前人主要从概念的名称、属性、结构等方面来综合考虑概念的相似度。之前有先将概念相似度计算分为两层:“初始相似度”和“通过非上下位关系体现的相似度”,前者主要利用概念之间的距离计算得到,后者则是在前人计算的基础上,通过概念的非上下位关系计算得到;再综合二者就可得到领域本体内概念的实际相似度。除此之外,还有主要通过概念间的上下位关系以及其它因素来计算领域内部概念之间的语义相似度。例如,有人提出了一种综合的相似度计算方法,即先根据两个概念名称的相似性过滤出最相关的概念;再分别基于概念实例、概念属性和概念关系计算概念相似度,并进行综合。虽然现今许多应用由于使用海量数据可以在某种程度上掩盖这个问题,但在很多情况下,海量数据我的方式并不适用,忽略了语义研究使得计算得到的结果和人的主观感受的差异常常是谬以千里。故而语义的相似度计算在这种情况下就显得尤为重要了,如果可以获得每一个词语的相似词语,通过对相似词语的查询,无疑可以提高用户信息共享的效果,为了满足上述需求,本发明提出了一种基于本体概念的词汇语义相似度求解方法。
发明内容
针对如何获得每一个术语的相似术语问题,本发明提供了基于本体概念的词汇语义相似度求解方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:初始化统计方法模块。
步骤2:将待比较词(c1,c2)输入初始化统计方法模块中。
步骤3:将待比较词(c1,c2)映射到本体概念模块中。
步骤4:分别选取待比较词(c1,c2)对应深度最大的本体概念g1、g2。
步骤5:计算待比较词(c1,c2)对应深度最大的两本体概念间距离dis(g1,g2)。
步骤6:经过上述步骤,计算两待比较词(c1,c2)最近共同祖先的深度D(c1,c2)。
步骤7:计算两待比较词(c1,c2)的相似度sim(c1,c2)。
本发明有益效果是:
1、此计算词汇相似度方法在量化概念上更接近专家的经验值
2、此方法更充分、更综合考虑了待比较词(c1,c2)对应深度最大的本体概念间的距离、深度等因素,大大的提高了语义相似度结果的准确度。
3、更好的提高了本体推理的效果。
附图说明
图1基于本体概念的词汇语义相似度求解方法结构流程图
具体实施方式
为解决如何获得每一个术语的相似术语问题,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:初始化统计方法模块。
步骤2:将待比较词(c1,c2)输入初始化统计方法模块中。
步骤3:将待比较词(c1,c2)映射到本体概念模块中。
步骤4:分别选取待比较词(c1,c2)对应深度最大的本体概念g1、g2,其具体描述如下:
待比较词C∈(c1,c2)与概念之间是一对多的关系,当选取的概念深度越深,则待比较词C∈(c1,c2)则越具体,更方便计算待比较词C∈(c1,c2)的语义相似度。这个深度在统计模块块中很容易找到,例如在《知网》中找到词语对应的本体概念。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610833103.5/2.html,转载请声明来源钻瓜专利网。