[发明专利]一种基于医疗大数据的数据质量改进方法及系统有效
申请号: | 202010050443.7 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111241086B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 路杰;姚进文;牛宝童;蒲旭虹;殷利霞;白焕莉 | 申请(专利权)人: | 甘肃省卫生健康统计信息中心(西北人口信息中心) |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/245;G06F16/2455;G06F16/2458;G06F16/248;G06F16/25;G06F16/27;G16H10/60;G16H15/00;G16H40/20 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 730030 甘*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 医疗 数据 质量 改进 方法 系统 | ||
本发明属于数据质控技术领域,公开了一种基于医疗大数据的数据质量改进方法及系统,基于HIS原子指标值进行计算,通过规范明细数据、不规范明细数据、状态数据、原子指标汇总及其他字段级校验进行质量管理;基于平台原子值进行计算,通过公众服务平台采集数据对居民个人信息和服务就诊记录进行精细校验;基于BI原子指标值进行计算,以原子指标为导向对相关的基础表进行定向规则校验;编写动态sql执行语句,基于hadoop、hase计算引擎进行数据质控、统计。本发明基于医疗大数据用于改进数据质量的方法,可使用三径合一实现对数据多次数据校验进行数据质量的控制。
技术领域
本发明属于数据质控技术领域,尤其涉及一种基于医疗大数据的数据质量改进方法及系统。
背景技术
目前,最接近的现有技术:随着社会的发展,人们对医疗数据的高质量要求需求,以及医疗数据的准确性需求越来越大。而现有的大数据技术无法在一定的时间范围内用常规的软件工具进行数据质量管理,并且存在数据质量参差不齐的问题。
综上所述,现有技术存在的问题是:现有医疗数据类型复杂,数据质量不高。医院级别不统一导致校验数据难度大,校验时间过长。
解决上述技术问题的难度:由于数据类型复杂,医院数量众多,导致上传数据类型不统一。
医院上传数据存在差异性,导致上传的数据校验过程中错误较多,数据质量不高。
根据医院级别需要定义不同的评分标准,根据医院业务进行对标准的定制化。
医院上传数据差异性较大,导致校验时间耗时较长。
解决上述技术问题的意义:定义数据标准,根据医院上传的数据进行标准间的映射,达到所有医院上传的数据统一化,标准化,以便于在电子病历系统中的展示。
提供校验报告,协助医院进行校验报告中错误关系的修正,以便提高数据质量。
根据医院级别,定义不同的校验规则和评分规则,达到根据医院级别进行展示评分的效果。
定义上传标准,首先在数据采集前进行一次标准转换,达到将数据规范化,减少校验时的转换,达到快速的校验,减短校验时间。
发明内容
针对现有技术存在的问题,本发明提供了一种基于医疗大数据的数据质量改进方法。
本发明是这样实现的,一种基于医疗大数据的数据质量改进方法,所述基于医疗大数据的数据质量改进方法包括:
采用PDLMV数据清洗框架理论,进行多层级的数据校验,通过数据交换报告、数据校验报告、专题报告及其他聚合结果数据进行全方位展示。
进一步,所述基于医疗大数据的数据质量改进方法包括以下步骤:
步骤一,基于HIS原子指标值进行计算,通过规范明细数据、不规范明细数据、状态数据、原子指标汇总及其他字段级校验进行质量管理;
步骤二,基于平台原子值进行计算,通过公众服务平台采集数据对居民个人信息和服务就诊记录进行精细校验;
步骤三,基于BI原子指标值进行计算,以原子指标为导向对相关的基础表进行定向规则校验;
步骤四,编写动态sql执行语句,基于hadoop、hase计算引擎进行数据质控、统计。
本发明的另一目的在于提供一种实施所述基于医疗大数据的数据质量改进方法的基于医疗大数据的数据质量改进系统,所述基于医疗大数据的数据质量改进系统包括:
数据校验模块:用于采用PDLMV数据清洗框架,进行三径合一的多级数据校验;
数据交换模块:用于采用ETL中间件KETTLE进行数据交换;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甘肃省卫生健康统计信息中心(西北人口信息中心),未经甘肃省卫生健康统计信息中心(西北人口信息中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010050443.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置