[发明专利]一种混合求解本体概念语义相似度的计算方法在审
申请号: | 201610833704.6 | 申请日: | 2016-09-20 |
公开(公告)号: | CN106611039A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 求解 本体 概念 语义 相似 计算方法 | ||
技术领域
本发明涉及语义网络技术领域,具体涉及一种混合求解本体概念语义相似度的计算方法。
背景技术
词语相似度计算在信息检索、数据挖掘、机器翻译、个性化推荐等领域有广泛的应用,因此提高相似度计算结果的准确性显得尤为重要。随着领域本体的不断普及,以及本体树对概念节点之间关系的准确描述,本体已经成为语义相似度研究的基础。当前基于本体的相似度计算主要分为基于语义距离、基于信息内容、基于属性、混合式相似度计算。基于语义距离的方法是最早采用的本体相似度计算方法,此方法通过概念词在本体树中的路径长度来量化概念节点之间的语义距离。基于信息内容的方法是用概念共同父节点的信息量来衡量二者的相似度,节点的信息量用节点包含内容在本体中出现的频率p来衡量。为了提高本体概念间语义相似度的结果准确度,混合式相似度计算是目前比较常见的相似度算法,这里综合考虑信息量、概念属性来计算。基于上述需求,本发明提供了一种混合求解本体概念语义相似度的计算方法。
发明内容
针对于如何提高本体概念间语义相似度的结果准确度问题,本发明提供了一种混合求解本体概念语义相似度的计算方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:初始化本体概念领域模块。
步骤2:求解其共同父节点在在树状层次结构中的信息量值I(pr)。
步骤3:分别求解两本体概念(g1,g2)在树状层次结构中的信息量值I(g1)、I(g2)。
步骤4:求解两本体概念(g1,g2)属性之间的相似度sim2(g1,g2)。
步骤:5:综合上述步骤,可以得出两本体概念间的语义相似度sim(g1,g2)。
本发明的有益效果是:
1、相比较传统的基于信息论方法求解语义相似度,此方法准确度更高。
2、此计算概念语义相似度的方法在量化概念上更接近专家的经验值。
3、此计算模型能够比较准确的反映概念之间的语义相似度。
4、此算法模型考虑的更加全面,综合了概念属性间的相似度问题,计算结果也更加的准确。
5、更好的提高了本体推理的效果。
6、具有更广泛的应用研究价值。
附图说明
图1为一种改进的基于信息论的概念语义相似度计算方法结构流程图。
图2为本体概念领域模块语义树形图。
具体实施方式
为了解决上述问题,本发明提出了一种混合求解本体概念语义相似度的计算方法。
为了提高本体概念间语义相似度的结果准确度问题,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:初始化本体概念领域模块。
步骤2:求解其共同父节点在在树状层次结构中的信息量值I(pr),其具体计算过程如下:
基于信息内容的计算相似度方法主要是通过衡量概念所包含的信息量来计算相似度。概念是对其祖先节点的继承,是祖先节点的又一次细化,所以可通过祖先节点包含的信息量来衡量两个概念的共享信息。
求解其共同父节点在树状层次结构中的信息量值I(pr)
根据图2,得出两本体概念(g1,g2)共同父节点在树状层次结构中出现的概率值p(pr)
上式n(pr)为(g1,g2)共同父节点在本体树中出现的次数,为父节点的直接子节点(g1,g2,…,gk)在本体树中出现的总次数,n(o)为本体树的总节点数。上式k为共同父节点直接子节点的个数。
即I(pr)=-p(pr)lnp(pr)
步骤3:分别求解两本体概念(g1,g2)在树状层次结构中的信息量值I(g1)、I(g2),其具体求解过程如下:
求解两本体概念的在树状层次结构中的信息量值I(g1)、I(g2)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610833704.6/2.html,转载请声明来源钻瓜专利网。