[发明专利]一种基于子图近似同构的学习资源本体匹配方法在审
申请号: | 201711246006.7 | 申请日: | 2017-12-01 |
公开(公告)号: | CN107798146A | 公开(公告)日: | 2018-03-13 |
发明(设计)人: | 习海旭;高伟;于枫 | 申请(专利权)人: | 江苏理工学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙)32231 | 代理人: | 常莹莹 |
地址: | 213001 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 近似 同构 学习 资源 本体 匹配 方法 | ||
技术领域
本发明涉及一种本体匹配方法,尤其是一种基于子图近似同构的学习资源本体匹配方法。
背景技术
目前,本体匹配是解决由不同数据规范、建模方法和技术创建的异构本体相互整合问题的关键技术,本体匹配方法主要有基于语言学的、结构的和实例的。基于语言学的本体匹配方法难以定义科学的语义距离;基于结构的本体匹配方法大多只着眼于本体自身的层次结构,较少考虑其他关系对本体匹配的影响;基于实例的本体匹配方法受限于机器学习技术自身的复杂性、计算性能、正确性及优化等问题的困扰,在实际本体匹配应用中的有效性尚待考查。
国外学者自20世纪90年代开始针对本体匹配的研究,已形成很多著名的本体匹配系统。在本体匹配方法上,按匹配时的信息粒度、输入类型为标准,主要有元素级和结构级的本体匹配方法,其中元素级是指基于本体的单个实体信息而不考虑实体间关联性,结构级是指将本体各实体信息作为一个整体结构。基于结构的匹配方法中,本体结构特征的相似度传播是判定匹配的重要因素,但当前方法在结构相似度计算上过多依赖于邻接节点相似度,相似性传播大多需要遍历全图,计算量大且带有盲目性,尚待进一步深入研究。
基于结构的本体匹配中,图的匹配是一个NP完全问题,难以直接应用图结构的匹配来解决本体匹配,因此这类方法常常是通过对本体结构的相似性进行计算和匹配来实现的。一般的指导思想是:通过图中相邻元素的相似性来推测元素自身的相似度,即若节点的邻居节点相似,则节点本身也相似,其核心是相似度传播。最典型的两个基于结构的本体匹配算法SF和GMO,其核心思想都是:拥有相似父/子概念的概念可能相似,拥有相似属性的概念可能相似。其中,Similarity flooding算法的相似度传播只考虑已匹配概念对邻居节点的传播,GMO则是对全体全局进行相似度传播。
发明内容
为解决基于结构的本体匹配方法大多只着眼于本体自身的层次结构,较少考虑其他关系对本体匹配的影响,在结构相似度计算上过多依赖于邻接节点相似度,相似性传播大多需要遍历全图,计算量大且带有盲目性以及基于实例的本体匹配方法受限于机器学习技术自身的复杂性、计算性能、正确性及优化等问题的困扰,本发明提供一种基于子图近似同构的学习资源本体匹配方法,该方法在综合概念编辑距离、层次架构与其他关系相似性基础,对本体的有向图中交替进行点、边匹配,从而以子图近似同构来判定本体匹配;该方法以结构整体相似性为判断标准,有助于加强本体的匹配效率,提高本体资源的发现能力。
为实现上述目的,本发明采用下述技术方案:
一种基于子图近似同构的学习资源本体匹配方法,该方法包括以下步骤:
步骤一,锚点选择与子图抽取
在两个待匹配本体A、B的图结构中寻找可匹配的一对锚点,根据各本体上的锚点概念所处的不同位置情况,分别抽取该锚点概念导出的本体有向图;
步骤二,子图结构相似度计算
分别计算两个待匹配本体A、B有向图的节点编辑距离相似度、节点间层次关系相似度、节点间其他关系相似性和图的结构相似性;
步骤三,子图近似同构判定
进一步计算两个待匹配本体A、B及其有向图的同构近似值,对子图近似同构进行判定;
步骤四,基于子图近似同构的本体匹配
基于子图近似同构的本体相似度综合计算和基于子图近似同构的本体匹配。
进一步地,步骤一中锚点指两个待匹配本体A与B中第一对可确定相似的概念,表现在本体的有向图上第一对确定匹配的节点。其定义如下:给定两个待匹配本体A、B,其对应的图结构表示分别为G(A)、G(B),若对于G(A)中的一个节点x∈CA,在G(B)中存在节点y∈CB,有:
a)OM(x,y),即概念x与y可匹配;
b)
有
则称<x,y>为A、B的一对锚点,x与y称为锚点概念。
锚点概念导出的本体有向图Ox可表示为五元组其中:
a)Cx={c∈C|(cHcx)∨(xHcc)∨(cRx)∨(xRc)}是概念集;
b)Px={P→{Cx}}、Ix={I→{Cx}}是属性集、实例集;
c)Hcx={Hc→{Cx}}是Ox的概念间层次关系集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏理工学院,未经江苏理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711246006.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图片整理方法
- 下一篇:一种新闻客户端及其消息推送方法