[发明专利]基于本体概念的词汇语义相似度求解方法在审

申请号：	201610833103.5	申请日：	2016-09-20
公开（公告）号：	CN106611038A	公开（公告）日：	2017-05-03
发明（设计）人：	金平艳	申请（专利权）人：	四川用联信息技术有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	610054 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于本体概念词汇语义相似求解方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语义网络技术领域，具体涉及一种基于本体概念的词汇语义相似度求解方法。

背景技术

目前，很多学者在关注本体概念相似度的计算方法，相似度问题在哲学、语义学等多个学科中被深入的研究和分析。前人主要从概念的名称、属性、结构等方面来综合考虑概念的相似度。之前有先将概念相似度计算分为两层：“初始相似度”和“通过非上下位关系体现的相似度”，前者主要利用概念之间的距离计算得到，后者则是在前人计算的基础上，通过概念的非上下位关系计算得到；再综合二者就可得到领域本体内概念的实际相似度。除此之外，还有主要通过概念间的上下位关系以及其它因素来计算领域内部概念之间的语义相似度。例如，有人提出了一种综合的相似度计算方法，即先根据两个概念名称的相似性过滤出最相关的概念；再分别基于概念实例、概念属性和概念关系计算概念相似度，并进行综合。虽然现今许多应用由于使用海量数据可以在某种程度上掩盖这个问题，但在很多情况下，海量数据我的方式并不适用，忽略了语义研究使得计算得到的结果和人的主观感受的差异常常是谬以千里。故而语义的相似度计算在这种情况下就显得尤为重要了，如果可以获得每一个词语的相似词语，通过对相似词语的查询，无疑可以提高用户信息共享的效果，为了满足上述需求，本发明提出了一种基于本体概念的词汇语义相似度求解方法。

发明内容

针对如何获得每一个术语的相似术语问题，本发明提供了基于本体概念的词汇语义相似度求解方法。

为了解决上述问题，本发明是通过以下技术方案实现的：

步骤1：初始化统计方法模块。

步骤2：将待比较词(c₁，c₂)输入初始化统计方法模块中。

步骤3：将待比较词(c₁，c₂)映射到本体概念模块中。

步骤4：分别选取待比较词(c₁，c₂)对应深度最大的本体概念g₁、g₂。

步骤5：计算待比较词(c₁，c₂)对应深度最大的两本体概念间距离dis(g₁，g₂)。

步骤6：经过上述步骤，计算两待比较词(c₁，c₂)最近共同祖先的深度D(c₁，c₂)。

步骤7：计算两待比较词(c₁，c₂)的相似度sim(c₁，c₂)。

本发明有益效果是：

1、此计算词汇相似度方法在量化概念上更接近专家的经验值