[发明专利]基于HBase协处理器的类SQL查询的方法和系统有效
申请号: | 201610308094.8 | 申请日: | 2016-05-11 |
公开(公告)号: | CN107368477B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 邵先凯;李威;张鹏 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;姜劲 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 hbase 处理器 sql 查询 方法 系统 | ||
本发明提供一种基于HBase协处理器的类SQL查询的方法和系统,能够规范统一查询的条件及返回的结果,并能在避免对上层业务侵入的同时,执行高性能的实时数据并行计算。该方法包括:在HBase客户端预先配置HBase存储的表的元数据;建立上层业务接入连接,解析从上层业务传入的SQL查询语句,生成查询请求;所述HBase客户端将所述查询请求分发至RegionServer;所述RegionServer根据所述查询请求利用HBase协处理器并行查询和处理数据;所述HBase客户端合并由所述RegionServer返回的数据并封装结果集。
技术领域
本发明涉及计算机技术及软件领域,尤其涉及一种基于HBase协处理器的类SQL查询的方法和系统。
背景技术
近年来,电商行业不断发展,对于大数据的存储、抽取、计算、分析以及展示越来越受到各大电商的关注。随着电商数据的爆炸性增长及对大数据处理分析的迫切需求,同时由于数据存储空间与数据访问时间之间的矛盾,各大电商选择分布式的存储系统HBase(HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统)来对数据进行存储,以满足对数据高效的插入和读取操作。
但是由于业务需求的多样化,导致了针对HBase的原生API查询条件以及对其查询所得到的Key-Value数据模型趋于多元化、差异化,无法使得上层业务以一种统一的、规范的形式来进行对HBase数据的查询和计算;另外,单纯的使用HBase原生API来进行HBase的查询,并将查询所得到的数据在客户端进行单节点的计算,会导致了HBase资源没有充分利用且计算效率低下等问题。
目前,针对HBase上的查询引擎解决方案,根据与HBase的操作方式,可以分为两种:一种是以Map-Reduce为核心,结合Map-Reduce思想,单个任务使用HBase-Client API原始接口访问,以Hive SQL为代表;另一种是以HBase-Coprocessor为核心,结合GoogleDremel的思想,客户端合并多个节点的处理结果,以Phoenix为核心。
但是上述两种方式中,由于Hive基于Map-Reduce思想,数据查询响应时间长,实时性较差,在较小的数量级上的数据查询及计算的效率较低;而Phoenix对HBase有着极强的侵入性,其创建的表HBase可以识别并使用,但是使用HBase创建的表,Phoenix不能识别,因此无法应对现有线上HBase数据表的业务需求。故现有的针对HBase的查询方式并不能解决现有HBase查询过程中无法应对业务需求多样化需求及查询效率低下、HBase资源不能充分利用的问题。
发明内容
有鉴于此,本发明提供一种基于HBase协处理器的类SQL查询的方法和系统,能够规范统一查询的条件及返回的结果,并能在避免对上层业务侵入的同时,执行高性能的实时数据并行计算。
为实现上述目的,根据本发明的一个方面,提供了一种基于HBase协处理器的类SQL查询的方法。
本发明的基于HBase协处理器的类SQL查询的方法包括:在HBase客户端预先配置HBase存储的表的元数据;建立从上层业务接入连接,解析上层业务传入的SQL查询语句,生成查询请求;所述HBase客户端将所述查询请求分发至RegionServer;所述RegionServer根据所述查询请求利用HBase协处理器并行查询和处理数据;所述HBase客户端合并由所述RegionServer返回的数据并封装结果集。
可选地,所述上层业务接入连接采用JDBC连接方式。
可选地,解析从上层业务传入的SQL查询语句还包括:接收业务端的SQL查询语句,对SQL查询语句进行预处理,并通过词法、语法分析生成SQL查询请求。
可选地,所述HBase客户端将所述查询请求分发至RegionServer还包括:根据Rowkey信息将所述查询请求分发至所述RegionServer。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610308094.8/2.html,转载请声明来源钻瓜专利网。