[发明专利]大规模语义数据路径查询的方法无效
申请号: | 201110056579.X | 申请日: | 2011-03-09 |
公开(公告)号: | CN102129457A | 公开(公告)日: | 2011-07-20 |
发明(设计)人: | 吴朝晖;陈华钧;梁欣颖 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州裕阳专利事务所(普通合伙) 33221 | 代理人: | 应圣义 |
地址: | 310027 浙江省杭州市西湖*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于MapReduce编程框架地图的路径搜索技术领域,公开了一种大规模语义数据路径查询的方法,本发明通过基于MapReduce的编程框架,采用流行的图的路径查询排序的算法,完成大规模语义数据的关系路径的查询。本发明有效地实现了语义数据关系路径在数量级很大的情况下,路径查询也能很快进行,从返回结果上,不仅告诉用户,位于路径两端的两个本体是什么,更关键的是关心了具体这两个本体是怎么连接起来的,让用户清晰的看到这条链上的所有有关联的本体。 | ||
搜索关键词: | 大规模 语义 数据 路径 查询 方法 | ||
【主权项】:
大规模语义数据路径查询的方法,其特征在于,包括下列步骤:步骤A:需要定制查询路径的模式:a:查询路径的语法:查询路径表达式为基于本体的属性而非字符的正则表达式,该路径表达式基本能够满足查询需求;b:路径评估:路径按照难易程度分为以下两种:简单路径:路径表达式只包含连接(sequence)、取反(reverse)和{n},即路径长度固定;复杂路径:路径表达式中包含*, ,{},即该路径的长度可变;步骤B:分析路径表达式,将路径表达式进行拆分:所述的简单路径需要将路径表达式分成几个更简单的表达式,然后将其join(求交),连接起来,过程中需要迭代,如果其中间结果不满足路径条件,不作为最终结果;所述的复杂路径需要迭代,输出相应的结果;步骤C:MapReduce工作步骤:c:准备工作:将原路径表达式和分析好的路径表达式链记录;d:MapReduce的Mapper读入数据,其中以语义数据三元组中的Object(宾语)和Subject(主语)作为中的key,以其关联关系的属性链及宾语作为value,分发数据;e:Reducer接收数据后,根据拆分好的路径,对数据进行join操作,得到根据路径连接起来的本体链;f:重复步骤d和e,直到不会在产生新的根据路径连接起来的本体链,有区别的是在迭代的过程中,要将拆分好的路径链按照最初的路径表达式再一步步连接起来,恢复成原来的路径或与之等价的路径;g:根据路径,输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110056579.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种织物密度分布仿真系统
- 下一篇:数据仓库中大对象集合表的访问方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置