[发明专利]用于大规模数据存储的高效的基于列的数据编码无效
申请号: | 200980130984.2 | 申请日: | 2009-07-31 |
公开(公告)号: | CN102112962A | 公开(公告)日: | 2011-06-29 |
发明(设计)人: | A·耐茨;C·佩特克勒斯克;I·B·克里瓦特 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F7/76 | 分类号: | G06F7/76;G06F7/78 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运;钱静芳 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于列的数据编码,其中要压缩的原始数据按照列来组织,然后,作为数据大小的第一层和第二层缩减,向按列组织的数据应用字典编码和/或值编码,来创建对应于各列的整数序列。接着,混合贪婪行程长度编码和位打包压缩算法根据位节省分析来进一步压缩数据。混合数据缩减技术与基于列的组织相呼应的协同作用,加上归功于紧凑数据的表示的扫描和查询效率,以常规系统的一小部分成本得到了显著改进的数据压缩。 | ||
搜索关键词: | 用于 大规模 数据 存储 高效 基于 编码 | ||
【主权项】:
一种用于编码数据的方法,包括:根据对应于所述数据的不同数据字段的一组基于列的值序列来组织210所述数据;根据至少一个编码算法将所述一组基于列的值序列变换220成一组基于列的整数值序列;以及根据至少一个压缩算法压缩230所述一组基于列的整数序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200980130984.2/,转载请声明来源钻瓜专利网。
- 上一篇:弹性变形宫内节育器
- 下一篇:医用跟骨骨折复位固定调节器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置