[发明专利]医疗数据ETL任务中的数据核查方法及装置有效
申请号: | 202210254613.2 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114328700B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 秦晓宏;黄主斌 | 申请(专利权)人: | 上海柯林布瑞信息技术有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/21 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 何明伦 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 数据 etl 任务 中的 核查 方法 装置 | ||
本申请实施例提供了一种医疗数据ETL任务中的数据核查方法及装置,包括:在配置医疗数据ETL任务的任务流程过程中,确定至少一个需要进行数据核查的目标数据抽取组件;对于每一目标数据抽取组件,在该目标数据抽取组件之后添加数据核查点标志;执行医疗数据ETL任务的任务流程,在执行完每一目标数据抽取组件之后,基于该数据抽取组件对应的数据核查配置信息对该数据抽取组件进行数据核查得到核查结果。该方案在确定需要进行数据核查的数据抽取组件时,在配置任务流程的过程中对各数据抽取组件进行数据核查,节约了核查时间,提高了核查效率,考虑了各数据抽取组件的业务类型和所需处理的数据量,数据核查的适用性更强,且映射关系调整的难度更低。
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种医疗数据ETL任务中的数据核查方法及装置。
背景技术
医疗数据的ETL(Extract-Transform-Load,抽取-转换-加载)任务中,数据抽取任务是指通过预先配置的数据映射关系将医疗数据从源端抽取到目标端。由于原始医疗数据的质量不高,且业务口径较多导致数据的规范性无法得到保证,另外使用之后由后续业务层面再来反馈ETL任务的配置问题,耗时多反馈链路较长,因此通常在使用之前需要对ETL中数据抽取的数据的规范性进行核查,从而确定数据抽取过程中预先配置的数据映射关系是否满足医疗数据ETL任务的需要,然后对数据映射关系进行调整。
现有技术中核查方式通常是在所有数据抽取到目标端后,再对目标端的医疗数据进行核查。然而医疗数据的ETL任务涉及的抽取数据量非常大,抽取完所有任务需要的数据后再做核查耗费的时间非常长,严重影响了数据映射关系的确定效率。同时,医疗数据的ETL任务类型以及所抽取的数据量表现出较强的多样性,因此亟需提出一种适应不同医疗数据ETL任务场景下的高效数据核查方法。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,本申请实施例所提供的技术方案如下:
第一方面,本申请实施例提供了一种医疗数据ETL任务中的数据核查方法,包括:
在配置医疗数据ETL任务的任务流程过程中,对于每一数据抽取组件,若该数据抽取组件对应的数据量级别达到预设数据量级别和该数据抽取组件对应的业务类型为预设业务类型,则确定该数据抽取组件为目标数据抽取组件;
对于每一目标数据抽取组件,在该目标数据抽取组件之后添加数据核查点标志,所述数据核查点标志用于指示该目标数据抽取组件对应的数据核查配置信息;
执行所述医疗数据ETL任务的任务流程,在执行至每一目标数据抽取组件时,将该目标数据抽取组件抽取到的数据存入预设临时表中,并基于所述数据核查点标志获取该目标数据抽取组件对应的数据核查配置信息,基于所述数据核查配置信息,对该目标数据抽取组件抽取的数据进行数据核查得到核查结果,若所述核查结果指示核查不通过,基于所述核查结果修改该目标数据抽取组件的映射关系。
在本申请的一种可选实施例中,该方法还包括:
在配置医疗数据ETL任务的任务流程过程中,基于ETL任务的业务需求,确定ETL任务中所包含的至少一对源端和目标端,并为每对源端和目标端配置对应的数据抽取组件。
在本申请的一种可选实施例中,为每对源端和目标端配置对应的数据抽取组件,包括:
基于每对源端和目标端中源端的数据结构和目标端的数据结构、以及业务需求,确定由源端数据到目标端数据的映射关系,并基于映射关系确定该对源端和目标端对应的数据抽取组件。
在本申请的一种可选实施例中,该方法还包括:
从目标数据抽取组件的映射关系所包含的目标端数据字段,确定出需要核查的目标端数据字段和对应的核查规则,并将需要核查的目标端数据字段和对应的核查规则作为数据核查配置信息按存储路径进行存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海柯林布瑞信息技术有限公司,未经上海柯林布瑞信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210254613.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种跨链消息提交方法及装置
- 下一篇:一种应用于ECMO仿真实训的人体模型
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置