[发明专利]一种Spark并行访问MPP数据库的方法在审
申请号: | 201710946027.3 | 申请日: | 2017-10-12 |
公开(公告)号: | CN107885779A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 孙旭 | 申请(专利权)人: | 北京人大金仓信息技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙)11210 | 代理人: | 秦月贞 |
地址: | 100083 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种Spark并行访问MPP数据库的方法,包括以下步骤Spark集群中的节点访问MPP数据库的入口,所述MPP数据库的入口收集表数据在MPP数据库集群中的分布信息并返回给Spark;Spark先将收到的每个数据节点作为一个分区,如果指定了关键列,则会依据关键列值的上下界,将每个分区再细分为多个分区;Spark将任务分配到执行节点,每个Spark执行节点通过JDBC连接对应的数据节点,Spark集群即可并行地访问MPP数据库。有益效果Spark可以通过JDBC连接到集群的一个管理节点上,获取表数据在集群节点间的分布信息,然后通过JDBC连接到多个数据节点并行地获取表数据,大大提高访问速度。 | ||
搜索关键词: | 一种 spark 并行 访问 mpp 数据库 方法 | ||
【主权项】:
一种Spark并行访问MPP数据库的方法,其特征在于,包括以下步骤:S1 Spark集群中的节点访问MPP数据库的入口,所述MPP数据库的入口收集表数据在MPP数据库集群中的分布信息并返回给Spark;S2 Spark先将收到的每个数据节点作为一个分区;S3 Spark将任务分配到执行节点,每个Spark执行节点通过JDBC连接对应的数据节点,Spark集群即可并行地访问MPP数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京人大金仓信息技术股份有限公司,未经北京人大金仓信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710946027.3/,转载请声明来源钻瓜专利网。
- 上一篇:全自动全功能洗车辅助喷水作业系统
- 下一篇:两轴式龙门全自动洗车机