[发明专利]基于OpenGauss的数据分组聚集方法有效
申请号: | 202310057261.6 | 申请日: | 2023-01-19 |
公开(公告)号: | CN116226296B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 黎俊云;何小栋 | 申请(专利权)人: | 广州海量数据库技术有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2457;G06F16/2455 |
代理公司: | 北京尚钺知识产权代理事务所(普通合伙) 11723 | 代理人: | 王海荣 |
地址: | 510510 广东省广州市天河区建*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 opengauss 数据 分组 聚集 方法 | ||
本发明涉及一种基于OpenGauss数据库的数据分组聚集方法及系统。本方法包括对有序集合中的数据进行扫描,根据当前的分组情况和扫描获得的数据信息选择相应的措施对数据进行分组处理;按照上步获得的分组对数据进行聚集运算处理等步骤。本方法克服了现有数据分组聚集方法普遍存在的执行效率低下的缺陷,本发明方法在进行数据分组聚集操作时,只维护排序靠前的N个分组,而对最终不需要返回的数据进行丢弃处理,从而避免了无用的排序和分组操作造成的额外性能开销,减少了分组数据的存储和运算成本,提升了数据分组聚集操作的执行效率,并保证了系统性能的稳定,可以很好地满足海量数据处理的应用需求。
技术领域
本发明属于OpenGauss数据库管理系统技术领域,尤其涉及一种基于OpenGauss数据库的数据分组聚集方法及系统。
背景技术
SQL聚集是指对一组数据进行汇总的操作,输入是一组数据的集合,输出是单个数据值。常见的聚集操作有COUNT、MAX、MIN、SUM、AVG等。作为一种常用的数据分析技术,在数据库SQL里使用聚集操作进行数据分析,是非常普遍的。
随着互联网技术的日新月异,数据存储和分析技术蓬勃发展,互联网每分每秒都在产生大量数据。人们对海量数据的存储、分析需求日益增长,如何高效分析海量数据,已成为数据库技术面临的主要挑战,同样地,现有的数据分组聚集方法也因其执行效率低下而亟需进行技术改进。
以下面的SQL为例,
select max(l_orderkey),l_orderkey from lineitem group by l_orderkeyorder by l_orderkey limit 3;
目前多采用以下数据分组聚集方法进行处理:
(1)先分组(group by),后排序(order by),最后取排序靠前的几个分组(limit)。该方案的缺点是进行分组步骤时,必须对所有数据进行分组聚集,然而最后只需要取排序靠前的几个分组,最终导致大量无用的数据参与了分组和聚集运算,导致系统性能下降。
(2)先排序(order by),后分组(group by),最后取排序靠前的几个分组(limit)。该方案的缺点则是进行排序步骤时,必须对所有数据进行排序,导致大量最后不需要的数据参与了排序,从而造成了系统性能下降。
显而易见,上述数据分组聚集方法由于执行过程中均进行了大量的无用数据处理从而导致了执行效率低下,无法很好地满足海量数据处理的应用需求。
发明内容
为了克服现有数据分组聚集方法存在的上述缺陷,本发明提出了一种新的数据分组聚集方案。
整体而言,本发明数据分组聚集方法基于OpenGauss数据库系统,在进行数据分组聚集操作时,只维护排序靠前的N个分组(Limit N),而对最终不需要返回的数据进行丢弃处理,从而避免了无用的排序和分组操作造成的额外性能开销,解决了现有方法效率低下的问题,大大提升了数据分组聚集操作的执行效率,保证了系统性能的稳定。
具体地,第一方面,本发明提供了一种基于OpenGauss的数据分组聚集方法,当任务为在一个有序集合里维护排序靠前的N个分组时,本方法包括:
S1.数据扫描分组:对所述有序集合中的数据进行扫描,根据当前的分组情况和扫描获得的数据信息选择相应的措施对数据进行分组处理;
S2.聚集运算处理:按照上步获得的分组对数据进行聚集运算处理。
进一步地,本发明基于OpenGauss的数据分组聚集方法步骤S1中所述根据当前的分组情况和扫描获得的数据信息选择相应的措施对数据进行分组处理,包括:
S11.若新数据对应的分组属于Top-N目标组,则直接将该数据写入对应的分组中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州海量数据库技术有限公司,未经广州海量数据库技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310057261.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置