[发明专利]共同分片和随机化共同分片在审
| 申请号: | 202080005621.2 | 申请日: | 2020-03-18 |
| 公开(公告)号: | CN112805695A | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 亚历山大·凯辛;亚历山大·劳埃德;塞巴斯蒂安·坎塔克 | 申请(专利权)人: | 谷歌有限责任公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;周亚荣 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 共同 分片 随机化 | ||
本技术涉及在分布式存储系统中对表进行共同分片。可以接收包括一个或多个行的数据表。数据表中的每个行可以包括标识符键和数据段。可以将所述数据表中的每个数据段索引到索引表的单独行中,其中所述索引表中的每个行都包括与从中索引了所述相应行中的该数据段的所述数据表的所述标识符键相关联的数据。可以将所述索引表分片成裂片,其中所述分片包括基于从中索引了所述相应行中的该数据段的所述数据表的所述标识符键将所述索引表的每个行分配给所述裂片中的一个裂片。可以将所述裂片存储到所述分布式存储系统的两个或更多个部分中。
相关申请的交叉引用
本申请要求于2019年3月20日提交的名称为Cosharding and RandomizedCosharding(共同分片和随机化共同分片)的美国临时申请第62/821,156号的权益,其公开内容通过引用并入本文。
背景技术
关系数据库通常与布置在表格中的数据一起操作,以进行有效的存储和检索。随着表的增长,数据通常分布在许多数据库服务器上。但是,将表分开到不同数据库服务器可能会降低关系数据库在检索数据时的效率。在这方面,可能需要分布式操作(即,需要在数据库中心内的不同数据库服务器或组件之间进行通信的操作)来定位和检索被检索的数据。
发明内容
本公开总体上涉及对表进行共同分片(cosharding)。该技术的一个方面针对一种用于在分布式存储系统内对表进行共同分片的方法。该方法可以包括:通过一个或多个处理器接收包括一个或多个行的数据表,其中每个行包括标识符键和数据段;通过一个或多个处理器将数据表中的每个数据段索引到索引表的单独行中,其中索引表中的每个行都包括与从中索引了相应行中的数据段的数据表的标识符键相关联的数据;通过一个或多个处理器将索引表分片成裂片,其中分片包括基于从中索引了相应行中的该数据段的数据表的标识符键将索引表的每个行分配给裂片中的一个裂片;以及通过一个或多个处理器将裂片存储到分布式存储系统的两个或更多个部分中。
在一些示例中,可以与数据表的相应行的数据段被索引到的一个或多个索引表行一起,对来自数据表的一个或多个行进行分片。在一些实例中,可以将来自数据表的一个或多个行存储在与数据表的相应行的数据段被索引到的一个或多个索引表行相同的裂片中。
在一些示例中,数据表中的数据可以在数据表的一个或多个列中。
在一些示例中,其中,标识符键可以包括随机生成数。在一些实例中,标识符键可以包括时间戳。在一些示例中,裂片可以按时间戳排序。
在一些示例中,标识符键可以包括单调递增或递减值。在一些实例中,裂片可以按单调递增或递减值排序。
在一些示例中,可以将整个索引表分片为裂片。
在一些示例中,可以将裂片存储到分布式存储系统的两个或更多个部分中可以包括:将第一裂片存储到分布式存储系统的两个或更多个部分中的第一部分中,并且将第二裂片存储到分布式存储系统的两个或更多个部分中的第二部分中。
在一些示例中,该方法可以包括:接收检索与所索引的数据段相关联的一个或多个键的请求;响应于接收到该请求,在第一裂片中通过分布式数据系统的第一服务器标识与所索引的数据段相关联的一个或多个键,并且在第二裂片中通过分布式数据系统的第二服务器标识与所索引的数据段相关联的一个或多个键;合并从第一裂片和第二裂片中标识出的键;并且通过分布式数据系统输出合并后的键。
在一些示例中,数据表中的每个行在分布式存储系统中存储的关系在线数据库中以事务方式被索引到索引表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080005621.2/2.html,转载请声明来源钻瓜专利网。





