[发明专利]一种医疗大数据仓库的创建方法及系统在审
申请号: | 201710146771.5 | 申请日: | 2017-03-13 |
公开(公告)号: | CN106709269A | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 吴军;高希余;巩玉强;代江波;赵华侨;赵康 | 申请(专利权)人: | 山东众阳软件有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30;G06Q50/22 |
代理公司: | 济南圣达知识产权代理有限公司37221 | 代理人: | 黄海丽 |
地址: | 250000 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 数据仓库 创建 方法 系统 | ||
1.一种医疗大数据仓库的创建方法,其特征是,包括如下步骤:
步骤(1):将各个医疗卫生信息系统的业务数据库中的共享数据和非共享数据通过ETL工具抽取、清洗、转换到ODS数据缓冲区;所述共享数据包括:医院资源中患者、医生、设备的基础信息;所述非共享数据包括:患者的医嘱信息、患者的检查信息、医生的晋升记录、医生的培训记录、医生的手术记录和设备的维修记录;
所述步骤(1)的步骤如下:
步骤(101):通过ETL工具从各个医疗卫生信息系统的业务数据库中抽取数据;所述业务数据库包括HIS、LIS或PACS;
步骤(102):向抽取数据中添加设定的数据抽取日期;
步骤(103):将添加数据抽取日期的数据存储到ODS数据缓冲区中;
步骤(2):将ODS数据缓冲区的共享数据通过ETL工具抽取、清洗、转换到ODS的共享数据区中;所述步骤(2)的步骤如下:
步骤(201):通过ETL工具从ODS数据缓冲区中抽取编码类数据和指标类数据;
步骤(202):根据需要,将编码类数据利用EMPI患者索引转换成统一信息编码,将统一信息编码存储到ODS的共享数据区中;所述编码类数据包括:业务字典,所述业务字典包括:医嘱字典、费用项目、患者列表、员工列表;
步骤(203):根据需要,依据指标类数据人为设定指标量纲规范,将指标量纲规范存储到ODS的共享数据区中;所述指标类数据包括:业务数据,所述业务数据包括:门诊人次、药品费用、抗菌药物使用、住院收入;
步骤(3):将ODS数据缓冲区的非共享数据抽取到数据仓库中;将ODS的共享数据区的共享数据抽取到数据仓库中;所述步骤(3)的抽取采用增量抽取方法,如果在抽取过程中无法判断增量,则在抽取时,应用ETL工具通过CDC技术实现增量抽取;所述步骤(3)在抽取的过程中加入抽取时间标志;所述步骤(3)的步骤如下:
步骤(301):从ODS中依据指标量纲规范、数据仓库模型和统一信息编码抽取数据;
所述数据仓库模型是指根据医疗行业业务结合《基于电子病历的医院信息平台建设方案》、《卫生信息数据元目录》标准按照八大主题域统一规划设计;所述八大主题域,包括:账务主题、组织机构和人员主题、医疗活动主题、医疗服务主题、医嘱主题、患者主题、资源主题和病历主题;
步骤(302):
将ODS共享数据区指标类数据依据指标量纲规范和数据仓库模型转换为事实表数据;
将ODS共享数据区编码类数据依据统一信息编码和数据仓库模型转换为纬度表数据;
将ODS数据缓冲区的非共享数据中的指标类数据依据指标量纲规范和数据仓库模型转换为事实表数据;
将ODS数据缓冲区的非共享数据中的编码类数据依据统一信息编码和数据仓库模型转换为纬度表数据;
步骤(303):对事实表数据根据主键进行字段更改捕捉;若字段有更改,则获取字段对应的变更数据,更新字段数据有效性标示,将变更的数据抽取到数据仓库中,结束;若字段没有变化,获取新增数据,将新增数据抽取到数据仓库中,结束;
捕捉(304):对维度表数据根据主键进行维度变化捕捉,若无变化就结束,若有变化则进行缓慢变化维处理,将变更的数据抽取到数据仓库中,结束。
2.如权利要求1所述方法所应用的系统,其特征是,包括:
ETL服务器,所述ETL服务器分别与医院的HIS、LIS、PACS、EMR业务数据库连接,所述ETL服务器将医院的各个业务数据库的数据采集过来后,进行抽取、清洗、转换,然后存储到数据库服务器的ODS数据缓冲区中,然后将ODS数据缓冲区中的共享数据通过ETL工具抽取、清洗、转换到ODS的共享数据区中;将ODS数据缓冲区的非共享数据抽取到数据仓库中;将ODS的共享数据区的共享数据抽取到数据库服务器的数据仓库中;应用服务器根据客户端的输入指令,从数据库服务器中调取相应的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众阳软件有限公司,未经山东众阳软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710146771.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用