[发明专利]用于扩展无共享系统的装置和方法有效
申请号: | 201180036769.3 | 申请日: | 2011-05-17 |
公开(公告)号: | CN103180835A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 布莱恩·哈根布什;加文·谢里;杰弗瑞·艾尔·科恩;克里斯·佩德罗第;约翰·埃谢尔曼;弗洛莱恩·迈克尔·华伦;乔·杰·肯特 | 申请(专利权)人: | 伊姆西公司 |
主分类号: | G06F12/00 | 分类号: | G06F12/00 |
代理公司: | 北京金信立方知识产权代理有限公司 11225 | 代理人: | 黄威;王智 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 扩展 共享 系统 装置 方法 | ||
技术领域
本发明总体上涉及在无共享系统中的数字数据的存储和检索。更具体地,本发明涉及一种采用最小服务中断来扩展无共享系统的技术。
背景技术
附图1中示出了本领域中已知的无共享网络100。所述无共享网络100或体系结构100包括主节点102和一组无共享节点104_A至104_H。每个无共享节点104具有它自己的专用存储器、磁盘和输入/输出设备,并独立于体系结构100中的其他节点运行。每个节点自给自足,在整个网络中无共享。因此,在整个系统中没有争论的焦点并没有共享系统资源。本体系结构的优点是它具有高扩展性。
数据库系统将数据存储在分布在无共享节点中的表中。通过将每个数据(例如,每个记录或每行)分配到节点之一来存储数据。数据通常根据两种方式之一分配给节点。一种方法是散列分布,使用散列函数映射数据到节点。另一个方法是以循环或随机方式将数据分配至节点。
散列计算得出的部分数据被称为分布键。分布键可以是复合键,也就是包含一行中的几个列。散列分布产生均匀的数据分布和具有相同分布键的协同定位记录(也就是指具有相同分布键的记录被分配至相同的节点)。协同定位数据经常被用于连接操作,连接操作中来自不同数据库表的数据被合并。在查询工作负载中,连接操作通常是成本最高的操作。通常通过选用连接列作为分布键,连接在每个节点的基础上被执行,而无需在处理步骤之间在节点中再分布数据。表的所有行都是使用相同的分布键进行分布。单独的表通常选择不同的分布键。
节点被增加至无共享系统用来容纳更多的数据或额外的查询工作负载。当新的节点加至系统,数据需要被再分布。数据再分布通常需要单个数据的审查和位置的再分配。再评估大型数据的每一行需耗费大量时间,例如再分配数千万TB字节的数据要花费数日。因此,当需要增加一个节点至无共享系统时,通常的做法就是安排几天的宕机时间。这就需要降低与扩大无共享数据存储相关的停机时间。
发明内容
一种包括可执行指令用于评估扩展无共享数据存储配置的方法和计算机可读存储介质。形成具有特定参数的数据再分布安排表。数据根据数据再分布安排表在扩展的无共享数据存储中再分布。
附图说明
结合下面详细的说明以及相关的附图,本发明能够得到更好的理解:
附图1图示了本领域中已知的无共享网络体系结构。
附图2图示了无共享网络的主节点在本发明一实施例中的应用。
附图3图示了无共享网络的无共享节点在本发明一实施例中的应用。
附图4图示了有关扩展鉴别器的处理操作在本发明一实施例中的应用。
附图5图示了安排表在本发明有关实施例中的应用。
附图6图示了依据本发明一实施例的表再分布操作的执行。
相同的标号代表多个附图中的视图的对应部分。
具体实施方式
图2示出了主节点202配置为执行本发明的操作。主节点202具有标准元件,例如一个或多个CPU210_A到210_N。所述CPU通过总线214连接到输入/输出设备212。输入/输出设备212可以包括标准元件,例如键盘、鼠标、显示器、打印机等等。网络接口电路216也连接至总线214上,使得主节点202在联网环境中进行操作。
存储器220同样连接至总线214上。存储器220用于存储执行本发明实施例的可执行指令。尤其是,存储器220存储扩展鉴别器222。所述扩展鉴别器222包括用于估计增加至无共享系统的一个或多个节点的可执行指令。基于已有的和增加的节点性能属性,扩展鉴别器222形成一个具有参数的数据再分布安排表224,存储在存储器220中。用户可以访问表224用来重新配置数据再分布任务和/或用来追踪数据再分布任务的进度。
图3示出了无共享节点304在本发明一实施例中的应用。所述无共享节点304也包括标准元件,例如一组CPU310A_到310_N连接至总线314。一组输入/输出设备312也连接至总线314。网络接口电路316同样连接至总线314,为网络提供连通性。
存储器320也连接至总线314。存储器320包括用于执行本发明的操作的数据和可执行指令。尤其是,存储器320包括具有可执行指令的再分布模块322,所述可执行指令用来在无共享数据库段324中再分布数据。所述再分布模块322根据数据再分布安排表来分布数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西公司,未经伊姆西公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180036769.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗哮喘的中药
- 下一篇:具有改善操作条件的用于两种不同颜色的检测装置