[发明专利]一种Flink状态存储优化方法及装置在审

专利信息
申请号: 202211385621.7 申请日: 2022-11-07
公开(公告)号: CN115687304A 公开(公告)日: 2023-02-03
发明(设计)人: 闫一帅;毛春阳 申请(专利权)人: 中盈优创资讯科技有限公司
主分类号: G06F16/21 分类号: G06F16/21;G06F16/22;G06F16/28;G06F11/30;G06N5/022;G06N20/00;G06N7/01
代理公司: 上海嘉蓝专利代理事务所(普通合伙) 31407 代理人: 金波
地址: 200000 上海市嘉*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 flink 状态 存储 优化 方法 装置
【说明书】:

发明公开一种Flink状态存储优化方法及装置,其中,该方法包括:性能采集器获取系统状态信息和数据库状态信息发送到调优控制器;调优控制器对系统状态信息和数据库状态信息进行分析,判断是否需要进行参数调优;若是则发送参数模型和调优规则给机器学习调优器;根据参数模型和调优规则,机器学习调优器利用知识库和机器学习,使用高斯过程回归模型结合贝叶斯优化算法,得出参数调整结果集并发送给调优控制器;调优控制器根据参数调整结果集,对RocksDB的配置参数进行动态调整。该方法及装置通过动态调整RocksDB参数,以使其在更好的运行状态下发挥更加极致的性能。

技术领域

本发明涉及大数据实时仓库领域,尤其是一种Flink状态存储优化方法及装置。

背景技术

Flink提供了内存存储、文件系统存储和RocksDB(基于LevelDB开发的一款提供键值存储与读写功能的LSM-tree架构引擎)存储等不同的状态存储方式。在使用Flink实时数据仓库写入数据场景中,经常需要将两条数据流进行JOIN(关联),将两条数据流的数据关联在一起生成业务需要的数据并输出。由于不同的数据流到达的先后顺序不定,需要使用interval join(Flink Sql的一种关联方式,可以让两条流进行JOIN时,左流或者右流中每条记录只关联另外一条流上同一时间段内的数据,且进行JOIN后,仍然保留输入流上的时间列,便于继续进行基于Event Time的操作)将数据缓存一段时间,等待左流和右流到达完成join。当业务场景数据量非常大,可达到每秒几十万条的数据规模时,在此规模下,就需要缓存超大状态存储,这种情况下要求需要cache(缓存)的容量非常大,导致内存成本过高,以及在大量数据下查询效率低下。

发明内容

为解决Flink实时数据仓库中需要缓存超大状态存储导致内存成本过高以及在大量数据下查询效率低下的问题,本发明提供一种Flink状态存储优化方法及装置,采用RocksDB作为状态存储方式,通过内存+磁盘模式存储,动态调整参数配置,具有存储量大、成本低和稳定性高等优点。

为实现上述目的,本发明采用下述技术方案:

在本发明一实施例中,提出了一种Flink状态存储优化方法,该方法包括:

性能采集器获取系统状态信息和数据库状态信息发送到调优控制器;

调优控制器对系统状态信息和数据库状态信息进行分析,判断是否需要进行参数调优;若是则发送参数模型和调优规则给机器学习调优器;

根据参数模型和调优规则,机器学习调优器利用知识库和机器学习,使用高斯过程回归模型结合贝叶斯优化算法,得出参数调整结果集并发送给调优控制器;

调优控制器根据参数调整结果集,对RocksDB的配置参数进行动态调整。

进一步地,高斯过程回归模型结合贝叶斯优化算法,得到如下算法函数:

u(x)=m(x)+k*s(x)

其中,x是样本参数值,m(x)是x的均值,s(x)是x的标准差,k是算法系数,k0是可调的算法系数;

通过上述算法函数,找出最大的u(x)即可。

进一步地,调优控制器监控参数调整后RocksDB的状态,并判断此次参数调整是否有效,若有效则发送更新知识库指令到机器学习调优器,进行知识库的更新。

进一步地,Flink给每个资源并发度分配了一个RocksDB实例,在Flink中的每个状态都是一个列族,不同的列族对应不同的SST文件/内存表。

在本发明一实施例中,还提出了一种Flink状态存储优化装置,该装置包括:

性能采集器,用于获取系统状态信息和数据库状态信息发送到调优控制器;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中盈优创资讯科技有限公司,未经中盈优创资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211385621.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top