[发明专利]RDF数据分布式并行语义编码方法有效
申请号: | 201610242787.1 | 申请日: | 2016-04-19 |
公开(公告)号: | CN105930419B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 汪璟玢;郑翠春 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458;G06F17/27 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种RDF数据分布式并行语义编码方法,具体包括以下步骤:步骤S1:读入RDF本体文件,构建类关系模型和属性关系模型;步骤S2:读入RDF数据文件,将三元组分割成三元组项,将三元组项按类划分,并删除重复的三元组项,同时生成前缀编码;对三元组项进行过滤,用以确保RDF三元组编码的一致性,使得同一个三元组项不会分配到不同的编码;步骤S3:将三元组项进行编码,生成字典表;步骤S4:将三元组进行编码,生成编码后的三元组文件;步骤S5:将步骤S4的结果文件作为此步骤的输入,根据步骤S3中的字典表,反转生成原始RDF数据文件。本发明在分布式环境下结合本体能够高效地实现大规模数据的压缩编码与反转。 | ||
搜索关键词: | rdf 数据 分布式 并行 语义 编码 方法 | ||
【主权项】:
1.一种RDF数据分布式并行语义编码方法,其特征在于:具体包括以下步骤:步骤S1:读入RDF本体文件,构建类关系模型和属性关系模型,生成类及其编码的映射文件与属性及其编码的映射文件;步骤S2:读入RDF数据文件,将三元组分割成三元组项,将三元组项按类划分,并删除重复的三元组项,同时生成前缀编码;对三元组项进行过滤,用以确保RDF三元组编码的一致性,使得同一个三元组项不会分配到不同的编码;步骤S3:将三元组项进行编码,生成字典表;步骤S4:将三元组进行编码,生成编码后的三元组文件;步骤S5:将步骤S4的结果文件作为此步骤的输入,根据步骤S3中的字典表,反转生成原始RDF数据文件;其中,所述步骤S1中,首先将RDF数据格式的本体文件进行Jena解析,根据类关系生成关系树,构建类关系的模型;其中,定义类属性类型标记Flag用以标识所述类和所述属性,假设当前数据为v,则
定义树节点编码位数TreenodeDigit,简称TD,若总节点数为M,则
定义类编码TreeClasscode,简称TC,TC由Flag、直系父类个数标记、父类节点顺序编码和节点顺序编码构成;其中,总节点数为M,父类节点顺序编码的位数与节点顺序编码的位数都为TD(M);TC(h,i)表示第h层的第i个节点A的类节点编码;f(h,i)表示第h层的第i个节点A的节点顺序编码,REPT(0,n)表示为产生n个0;设anc(h)表示第h层的类节点顺序编码,f(h‑1,m)表示节点A的父类节点B的节点顺序编码,则
TC(h,i)=Flag&IPF&REPT(0,TD(M)‑TD(f(h‑1,m)))&f(h‑1,m)&REPT(0,TD(M)‑TD(f(h,i)))&f(h,i)当IPF>1时,父类节点顺序编码为所有直系父类的节点顺序编码的组合;定义属性编码TreePropertycode,简称TP,TP由Flag、类编码、父属性节点顺序编码和节点顺序编码构成;其中,总节点数为M,父属性节点顺序编码的位数与节点顺序编码的位数都为TD(M);TP(h,i)表示第h层的第i个节点C的属性节点编码,C所属的类设为R,其类节点编码表示为TC(p,r);f(h,i)表示第h层的第i个节点C的节点顺序编码,REPT(0,n)表示为产生n个0;设anc(h)表示第h层的属性节点顺序编码,f(h‑1,m)表示节点C的父属性节点D的节点顺序编码,则
TP(h,i)=Flag&TC(p,r)&REPT(0,TD(M)‑TD(f(h‑1,m)))&f(h‑1,m)&REPT(0,TD(M)‑TD(f(h,i)))&f(h,i);所述关系树为一棵多叉树,通过广度优先算法结合类编码的定义,得到属性关系的关系树,生成类编码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610242787.1/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置