[发明专利]一种医疗数据字典自动标准化的方法与系统有效
申请号: | 201610173625.7 | 申请日: | 2016-03-24 |
公开(公告)号: | CN105787282B | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 孟群;胡建平;曲建明 | 申请(专利权)人: | 国家卫生计生委统计信息中心;成都金盘电子科大多媒体技术有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F17/27 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 100000 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 数据 字典 自动 标准化 方法 系统 | ||
1.一种医疗数据字典自动标准化的方法,其特征在于:它包括以下步骤:
S1:本地客户端向云计算端上传未知标准符合性的数据字典;
S2:云计算端将上传的未知标准符合性的数据字典与中心标准字典进行匹配,自动建立两个字典之间的对应关系;
S3:云计算端形成标准化的对应关系文件;
S4:云计算端将标准化的对应关系文件下发至本地客户端,本地客户端通过标准化的对应关系文件对本地数据进行标准化;
所述的中心标准字典包括标准字段值域字典,在进行匹配的时候采用值域匹配知识库和字段语义知识库;
所述的步骤S2包括以下子步骤:
S201:云计算端解析文件至数据源字段;
S202:调取标准字段值域字典;
S203:将数据源字段进行值域校验,判断字段是否标准:若判断结果发现字段中有不标准部分则进入步骤S204,否则进入步骤S208;
S204:对不标准部分的字段进行分类并归类;
S205:调用值域匹配知识库,判断知识库是否能匹配不标准部分的字段:若判断为能完全匹配则进入步骤S207,否则进入步骤S206;
S206:对无法进行值域匹配知识库匹配的部分,发送至本地客户端,用户通过本地客户端自主进行字段值域修改,并将结果发送回云计算端,返回步骤S203;
S207:自动建立可识别字段值域标准化规则;
S208:调用字段语义知识库,判断是否能自动识别语义匹配字段:如果可以自动匹配字段,进入步骤S209,否则进入步骤S210;
S209:生成中心字典标准化映射方法,进入步骤S211;
S210:对无法自动匹配字段的部分,发送至本地客户端,用户通过本地客户端进行自行映射,并将结果发送回云计算端,返回步骤S208;对于可以自动匹配字段的部分,云计算端对中心标准字典进行更新;
S211:整合标准化映射方法包。
2.根据权利要求1所述的一种医疗数据字典自动标准化的方法,其特征在于:还包括一个用户登录步骤S0,包括以下子步骤:
S01:用户通过本地客户端登陆,建立与云计算端的连接关系;
S02:用户选择建立新的对应关系文件即进入步骤S1,或者是选择下载原有的对应关系文件。
3.根据权利要求2所述的一种医疗数据字典自动标准化的方法,其特征在于:当用户选择下载原有的对应关系文件,云计算端向本地客户端下发原有的对应关系文件的信息,包括对应关系文件建立时间和用户自定义对应关系文件名称;所述的用户自定义对应关系文件名称为在步骤S4云计算端将标准化的对应关系文件下发至本地客户端后,用户自定义的名称。
4.一种医疗数据字典自动标准化的系统,其特征在于:包括多个本地客户端和一个云计算端;所述的本地客户端包括:
数据字典上传模块:用于将未知标准符合性的数据字典向云计算端上传;
标准化文件接收模块:用于接收来自云计算端的标准化的对应关系文件;
本地数据标准化模块:通过标准化文件接收模块接收到的标准化的对应关系文件,对本地数据进行标准化;
所述的云计算端包括:
数据字典接收模块:用于接收来自本地客户端上传的未知标准符合性的数据字典;
数据字典自动匹配模块:用于将来自本地客户端上传的未知标准符合性的数据字典与中心标准字典进行匹配,建立对应关系;
对应关系文件形成模块:用于根据数据字典匹配模块得到的对应关系结果生成对应关系文件;
对应关系文件下发模块:用于将生成的对应关系文件下发至本地客户端;
中心标准字典存储模块:用于存储标准化数据字典的数据;
中心标准字典对应关系存储模块:用于存储与中心标准字典的对应关系;
所述的数据字典自动匹配模块包括:
文件解析子模块:用于将文件解析至数据源字段;
字段值域校验子模块:用于将数据源字段进行值域校验,判断字段是否标准;
分类子模块:用于将字段值域校验子模块判断出的不标准部分进行分类并归类;
值域匹配子模块:用于判断值域匹配知识库是否能匹配不标准部分的字段;
标准化规则建立子模块:用于对字段语义匹配子模块能匹配的部分自动建立可识别字段值域标准化规则;
字段语义匹配子模块:用于对值域匹配子模块输出的标准字段以及对标准化规则建立子模块输出的可识别字段值域标准化规则进行判断,判断字段语义知识库是否能自动识别语义匹配字段;
通知与选择项下发子模块:用于对值域匹配子模块不能匹配的部分以及对字段语义匹配子模块无法自动匹配的部分,向本地客户端发送通知与选择项;
中心字典标准化映射方法生成子模块:用于对字段语义匹配子模块中可自动匹配的字段生成中心字典标准化映射方法;
整合子模块:用于对中心字典标准化映射方法生成子模块输出的映射方法整合为标准化映射方法包,并发送至对应关系文件形成模块;
所述的中心标准字典存储模块包括:标准字段值域字典,值域匹配知识库和字段语义知识库;
所述的本地客户端还包括:
通知与选择项查看模块:用于查看云计算端下发的通知与选择项;
自行匹配模块:用于将未知标准符合性的数据字典或者是匹配失败数据与云计算端下发的选择项进行自行匹配;
自行匹配上传模块:将自行匹配模块的上传结果上传至数据字典自动匹配模块相应的子模块中,包括字段语义匹配子模块和值域匹配子模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家卫生计生委统计信息中心;成都金盘电子科大多媒体技术有限公司,未经国家卫生计生委统计信息中心;成都金盘电子科大多媒体技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610173625.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生成榜单数据的系统、设备、装置及方法
- 下一篇:孕周确定方法和系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置