[发明专利]Hudi运行环境资源优化分配方法及装置有效
申请号: | 202210117140.1 | 申请日: | 2022-02-08 |
公开(公告)号: | CN114153620B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 秦晓宏;黄主斌 | 申请(专利权)人: | 上海柯林布瑞信息技术有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F16/182 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 何明伦 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种Hudi运行环境资源优化分配方法及装置,包括:启动预设数量的计算引擎会话Spark Session,并对各Spark Session按对应的资源大小进行分类,得到至少两个Spark Session集合,并确定每个Spark Session集合对应的任务数据量范围;若医院的业务系统有增量医疗数据产生,则获取增量医疗数据对应的Hudi表任务所对应的数据量大小,并将Hudi表任务加入任务执行队列;在Hudi表任务处于任务执行队列的头部时,基于Hudi表任务的数据量大小和各Spark Session集合对应的任务数据量范围,确定出目标Spark Session,并利用目标Spark Session执行Hudi表任务,以将增量医疗数据添加至对应的Hudi表中。该方案节约了资源等待时间,同时能够为不同数据量大小的Hudi表任务匹配合适的目标Spark Session,提高了医疗数据存储的实时性。 | ||
搜索关键词: | hudi 运行 环境 资源 优化 分配 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海柯林布瑞信息技术有限公司,未经上海柯林布瑞信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210117140.1/,转载请声明来源钻瓜专利网。