[发明专利]一种基于多数据源的本体学习方法在审
申请号: | 201710444905.1 | 申请日: | 2017-06-12 |
公开(公告)号: | CN107330007A | 公开(公告)日: | 2017-11-07 |
发明(设计)人: | 季秋;孙哲;孙知信 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司32200 | 代理人: | 朱桢荣 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多数据源的本体学习方法,该方法采用本体匹配技术计算多数据源中概念、属性和实例之间的关系,将输入的单个数据源进行信息扩充,并在获得学习结果后,结合多数据源中可能有的权重信息以及学习中获得的权重信息进行本体的构建。目前的本体学习方法往往只局限于从单数据源进行本体学习,而忽略了从日益丰富的现有本体库和知识图谱资源中获取相关信息,对单数据源进行扩充。在学习到的公理的基础上构建本体时,本方法可采用多种策略进行本体调试和修补。对扩充后的数据源进行公理学习往往可以得到更多正确的学习结果,本发明通过试验对此结论进行验证。 | ||
搜索关键词: | 一种 基于 多数 本体 学习方法 | ||
【主权项】:
一种基于多数据源的本体学习方法,其特征在于,包括以下步骤:步骤1、从已有本体库和知识图谱中,通过人工选择或本体间相似度计算工具,选择与输入数据源S领域相关的数据源T;步骤2、使用本体匹配技术计算数据源S与步骤1选择出的数据源T之间的关系,并根据这些关系对数据源S的信息进行扩展;具体如下:步骤2‑1、根据本体匹配技术中的模式匹配技术,获得数据源S与数据源T中概念和属性之间的对应关系;步骤2‑2、如果数据源S中的概念C1对应到数据源T中的概念C2,则在数据源S中声明概念C1等价于概念C2;如果数据源T中概念C2包含某个实例,则在数据源S中声明该实例是概念C1的实例;步骤2‑3、如果数据源S中的属性P1对应到数据源T中的属性P2,则在数据源S中声明属性P1等价于属性P2;如果数据源T中属性P2包含某个实例,则在数据源S中声明该实例是属性P1的实例;步骤2‑4、根据本体匹配技术中的实例匹配技术,获得数据源S与数据源T中实例之间的对应关系;如果数据源S中的实例I1对应到数据源T中实例I2上,则在数据源S中声明实例I1等于实例I2;步骤3、对扩充后的数据源S的不一致性进行处理,使得数据源S的不一致度低于预设的阈值;步骤4、挑选一个公理学习工具,将经步骤3处理过的数据源S作为其输入,展开公理学习;步骤5、对公理学习的结果进行过滤,具体如下:步骤5‑1、根据预设的阈值,删除学习结果中权重小于阈值的公理;步骤5‑2、删除掉包含OWL、RDF和RDFS本体语言中专用词汇的公理;步骤6、根据步骤5中过滤后的结果构建本体,并通过本体调试和修补策略达到本体的一致。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710444905.1/,转载请声明来源钻瓜专利网。