[发明专利]医疗数据补充方法和装置有效
申请号: | 201710033547.5 | 申请日: | 2017-01-16 |
公开(公告)号: | CN108319451B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 丁文超 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F8/20 | 分类号: | G06F8/20;G06F16/22;G06F16/21;G16H10/60 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 阚梓瑄;王卫忠 |
地址: | 100191 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 数据 补充 方法 装置 | ||
本公开是关于一种医疗数据补充方法和医疗数据补充装置。该方法对从表进行医疗数据补充,待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有从表匹配字段;该医疗数据补充方法包括:从主表中提取公共键、主键以及主表匹配字段形成主表的分布式的Row对象的集合;将主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将公共键作为分布式的Java对象的集合的键;根据公共键对分布式的Java对象的集合进行聚合,并将主键对应填入需要的信息中;通过公共键链接需要的信息,并根据主表匹配字段与从表匹配字段的匹配性将需要的信息补充从表的待补充医疗数据。使从表记录的医疗数据达到可利用的目的。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种医疗数据补充方法和医疗数据补充装置。
背景技术
ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL在抽取数据过程中,由于元数据自身的系统缺陷,可能存在一些数据字段缺失问题,如果缺失的数据字段非常重要,可能导致大量数据无法得到有效利用。
例如,在实际医疗系统当中,检查(包括病理、放射、超声心动等)数据、实验室检验(血检、尿检等)数据,只记录了病人ID,并未记录就诊ID,这样会对医疗数据科研造成很大不便,因为医疗数据科研需要以就诊为粒度,研究每次就诊过程中,检查检验数据与入出院诊断、治疗情况之间的关系。合理补充就诊ID,对后期医疗数据科研有重大作用。
因此,有必要研究一种医疗数据补充方法和医疗数据补充装置,使记录的医疗数据达到可利用的目的。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种医疗数据补充方法和医疗数据补充装置,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本公开的一个方面,提供了一种医疗数据补充方法,对从表进行医疗数据补充,待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有从表匹配字段;所述医疗数据补充方法包括:
从所述主表中提取所述公共键、所述主键以及主表匹配字段形成主表的分布式的Row对象的集合;
将所述主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将所述公共键作为所述分布式的Java对象的集合的键;
根据所述公共键对所述分布式的Java对象的集合进行聚合,并将所述主键对应填入需要的信息中;
通过所述公共键链接所述需要的信息,并根据所述主表匹配字段与从表匹配字段的匹配性将所述需要的信息补充所述从表的待补充医疗数据。
在本公开的一种示例性实施例中,所述主表记录有就诊ID信息、病人ID信息、就诊时间以及病人的基本信息;所述从表记录有病人ID信息、检查时间以及检查信息。
在本公开的一种示例性实施例中,所述待补充医疗数据为就诊ID信息,所述公共键为病人ID信息,所述主表匹配字段为就诊时间,所述从表匹配字段为检查时间。
在本公开的一种示例性实施例中,所述主表匹配字段与从表匹配字段的匹配性为所述就诊时间与检查时间的接近性。
在本公开的一种示例性实施例中,所述医疗数据补充方法还包括:
从所述主表中提取所述公共键、所述主键以及匹配字段后,删除所述公共键为空格串或空串的行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710033547.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置