[发明专利]一种基于匿名谓词索引的RDF数据压缩及解压缩方法有效
申请号: | 201910705557.8 | 申请日: | 2019-08-01 |
公开(公告)号: | CN110457697B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 朱曼;黄鹏飞 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F40/253;G06F16/174 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210012 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于匿名谓词索引的RDF数据压缩及解压缩方法,RDF压缩方法为:将RDF数据集中的个体及谓词和个体的组合进行排序,形成个体以及谓词字典;将RDF数据集转化为头文件及0‑1比特矩阵形式;将矩阵的每一行0‑1比特序列对应于一个整数值;存储个体及谓词字典以及每一行所求得的整数值以及每一行中1的个数作为压缩后的数据。本发明避免了前向后向算法的复杂计算过程,对压缩和解压缩时间的提升效果非常显著,提升为现有技术中最接近方法的50%。 | ||
搜索关键词: | 一种 基于 匿名 谓词 索引 rdf 数据压缩 解压缩 方法 | ||
【主权项】:
1.一种基于匿名谓词索引的RDF数据压缩方法,其特征在于:包括以下步骤:/n(1)将RDF数据集中的个体及谓词和个体的组合进行排序,形成个体以及谓词字典;/n(2)将RDF数据集转化为头文件及0-1比特矩阵,其中0-1比特矩阵中的值计算如下:/n /n其中,Mij为矩阵第i行第j列的元素,si表示数据集中第i个个体,(p-o)j表示数据集中第j个谓词,(p-o)jp和(p-o)jo分别代表(p-o)j的谓语和对象;/n(3)将矩阵M的每一行0-1比特序列对应于一个整数值,给定0-1比特序列S,其对应的整数值通过下式求得:/n /n其中,b[k]是S中第k个1所在的位置,M是S中1出现的次数;/n(4)存储个体及谓词字典以及每一行所求得的整数值,以及每一行中1的个数作为压缩后的数据。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910705557.8/,转载请声明来源钻瓜专利网。