[发明专利]用于列表数据压缩的多重分类有效
| 申请号: | 201380017113.6 | 申请日: | 2013-03-13 |
| 公开(公告)号: | CN104205065B | 公开(公告)日: | 2017-09-29 |
| 发明(设计)人: | J·阿米特;L·德米多夫;N·哈洛瓦尼;S·马伦科夫 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F12/00 | 分类号: | G06F12/00;G06F5/00;G06F17/30 |
| 代理公司: | 北京市金杜律师事务所11256 | 代理人: | 酆迅,张凡 |
| 地址: | 美国纽*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 列表 数据压缩 多重 分类 | ||
技术领域
本发明一般地涉及计算机,并且更具体地涉及计算环境中的用于列表数据压缩的多重分类。
背景技术
在如今的社会中,计算机系统司空见惯。可以在工作地点、在家里或者在学校找到计算机系统。计算机系统可以包括用于处理和存储数据的数据存储系统或者盘存储系统。利用数据存储系统或者盘存储系统以处理和存储数据。存储系统可以包括一个或者多个盘驱动。这些数据处理系统通常需要大量数据存储。客户数据或者用户在数据处理系统内生成的数据占用该数据存储的大部分。这些计算机系统中的许多计算机系统包括虚拟存储部件。
计算系统用来存储和管理各种类型的数据,诸如列表数据(Tabular data)。列表数据通常被组织成行和列以形成例如如在关系表、字处理文档、电子表格或者电子表格式结构或者相似数据库结构中使用的常见表。这些表的形成包括用于行和列的多种组织的阵列和排列。然而,列表数据的实际物理存储可以采用多种形式。例如,虽然列表数据的逻辑结构可以是多维的,但是列表数据可以在物理上按线性格式来存储,诸如按照以行为主或者以列为主的格式。按以行为主的格式,来自表式结构的行的列值邻接地被存储于持久存储装置中。对照而言,按以列为主的格式,对于给定的列的多个行,邻接地存储该列的列值。
数据压缩广泛地用来减少为了处理、传输或者存储给定数量的信息而需要的数据数量。数据压缩是对数据进行编码以最小化它的表示。压缩可以例如用来减少用于文件的存储要求、增加通过信道的通信速率或者在加密之前减少冗余性以求更大安全性。列表数据结构也将从数据压缩中受益,因为数据压缩对减少昂贵资源、诸如硬盘空间或者传输带宽的消耗是有用的。
发明内容
技术问题
由于数据存储昂贵,所以明显地希望最小化为了存储结构化数据而需要的存储数量。此外,在存储位置之间复制或者传送数据序列时,希望最小化在数据库字段内在CPU周期、网络使用等方面的开销,已经对用于维护数据副本的技术进行了大量研究。在列表数据中,独立地压缩每列将提供比用一个流压缩整个表更高的压缩比。压缩比增加的原因在于每列中的数据相对地同质。然而,存储控制器不了解列表结构,因为它们不能应用列压缩算法并且不能从增加的压缩比中受益。作为结果,可能降低效率和生产率。
对问题的解决方案
因而并且鉴于前文,提供用于列表数据压缩的多重分类的各种示例方法、系统和计算机程序产品实施例。在一个实施例中,将相似类型的数据段分类成各类别,用于将数据段分组成与这些类别中的每个类别关联的压缩流。基于类列特定的优化编码操作对压缩流进行编码。压缩流进入一个输出缓冲器,其中该压缩流被提取。
除了前述示例方法实施例之外,还提供其它示例系统和计算机产品实施例,并且这些其它示例系统和计算机产品实施例提供有关优点。已经提供了前述发明内容以用简化形式介绍以下在具体实施方式中进一步描述的概念的选集。本发明内容不旨在于标识要求保护的主题内容的关键特征或者必需特征,它也不旨在于用作辅助确定要求保护的主题内容的范围。要求保护的主题内容不限于解决在背景技术中指出的任何或者所有缺点的实现方式。
为了容易理解本发明的优点,将通过参照在附图中图示的具体实施例来表现以上简要地描述的本发明的更具体描述。将理解这些附图描绘本发明的实施例,并因此不被视为限制其范围,将通过使用附图、利用附加特点和细节来描述和解释本发明。
附图说明
[图1]图1图示计算机存储环境,该计算机存储环境具有其中可以实现本发明的方面的示例存储设备。
[图2]图2图示示出在其中可以实现本发明的方面的计算机系统中的数据存储系统的硬件结构的示例框图。
[图3]图3是图示用于列表数据压缩的多重分类的示例方法的流程图。
[图4]图4图示示出多重分类基本压缩的示例框图。
[图5]图5图示示出其中可以实现本发明的方面的复用输出缓冲器的示例框图。
[图6]图6图示示出用于其中可以实现本发明的方面的列表数据压缩缓冲器的多重分类的示例框图。
[图7]图7是图示用于对用于列表数据压缩的多重分类进行编码的示例方法的流程图。
[图8]图8是图示用于将多重分类数据提取回原有的处理前输入数据块的示例方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380017113.6/2.html,转载请声明来源钻瓜专利网。





