[发明专利]共同分片和随机化共同分片在审
| 申请号: | 202080005621.2 | 申请日: | 2020-03-18 |
| 公开(公告)号: | CN112805695A | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 亚历山大·凯辛;亚历山大·劳埃德;塞巴斯蒂安·坎塔克 | 申请(专利权)人: | 谷歌有限责任公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;周亚荣 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 共同 分片 随机化 | ||
1.一种用于在分布式存储系统内对表进行共同分片的方法,所述方法包括:
通过一个或多个处理器接收包括一个或多个行的数据表,其中每个行包括标识符键和数据段;
通过所述一个或多个处理器将所述数据表中的每个数据段索引到索引表的单独行中,其中所述索引表中的每个行包括与从中索引了所述相应行中的所述数据段的所述数据表的所述标识符键相关联的数据;
通过所述一个或多个处理器将所述索引表分片成裂片,其中所述分片包括:基于从中索引了所述相应行中的所述数据段的所述数据表的所述标识符键,将所述索引表的每个行分配到所述裂片的一个裂片中;以及
通过所述一个或多个处理器将所述裂片存储到所述分布式存储系统的两个或更多个部分中。
2.根据权利要求1所述的方法,还包括:将来自所述数据表的所述一个或多个行与所述数据表的所述相应行的所述数据段被索引到的所述一个或多个索引表行一起进行分片。
3.根据权利要求2所述的方法,其中,来自所述数据表的所述一个或多个行被存储在与所述数据表的所述相应行的所述数据段被索引到的所述一个或多个索引表行相同的裂片中。
4.根据权利要求1所述的方法,其中,所述数据表中的所述数据在所述数据表的一个或多个列中。
5.根据权利要求1所述的方法,其中,所述标识符键包括随机生成的数,并且
所述裂片按时间戳排序。
6.根据权利要求1所述的方法,其中,所述标识符键包括时间戳,并且
所述裂片按所述时间戳排序。
7.根据权利要求1所述的方法,其中,所述标识符键包括单调递增或递减值,并且
所述裂片按所述单调递增或递减值排序。
8.根据权利要求1所述的方法,其中,将所述裂片存储到所述分布式存储系统的两个或更多个部分中包括:将第一裂片存储到所述分布式存储系统的两个或更多个部分中的第一部分中,并且将第二裂片存储到所述分布式存储系统的所述两个或更多个部分中的第二部分中。
9.根据权利要求8所述的方法,还包括:
接收用于检索与所索引的数据段相关联的一个或多个键的请求;
响应于接收到所述请求,在所述第一裂片中通过所述分布式数据系统的第一服务器标识与所索引的数据段相关联的所述一个或多个键,并且在所述第二裂片中通过所述分布式数据系统的第二服务器标识与所索引的数据段相关联的所述一个或多个键;
合并从所述第一裂片和所述第二裂片中标识出的键;
并且通过所述分布式数据系统输出所合并的键。
10.根据权利要求1所述的方法,其中,在所述分布式存储系统中存储的关系在线数据库中,所述数据表中的每个行以事务方式被索引到所述索引表中。
11.一种用于对表进行共同分片的系统,所述系统包括:
分布式存储系统;以及
一个或多个处理器,其中,所述一个或多个处理器被配置为:
接收包括一个或多个行的数据表,其中每个行包括标识符键和数据段;
将所述数据表中的每个数据段索引到索引表的单独行中,其中所述索引表中的每个行包括与从中索引了所述相应行中的所述数据段的所述数据表的所述标识符键相关联的数据;
将所述索引表分片成裂片,其中所述分片包括:基于从中索引了所述相应行中的所述数据段的所述数据表的所述标识符键,将所述索引表的每个行分配到所述裂片的一个裂片中;以及
将所述裂片存储到所述分布式存储系统的两个或更多个部分中。
12.根据权利要求11所述的系统,其中,所述一个或多个处理器还被配置为:将来自所述数据表的所述一个或多个行与所述数据表的所述相应行的所述数据段被索引到的所述一个或多个索引表行一起进行分片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080005621.2/1.html,转载请声明来源钻瓜专利网。





