[发明专利]基于转化医学分析平台的临床数据集成技术数据导入方法有效

专利信息
申请号: 201610947256.2 申请日: 2016-10-26
公开(公告)号: CN106503457B 公开(公告)日: 2018-12-11
发明(设计)人: 金涛;吕成;王建民 申请(专利权)人: 清华大学
主分类号: G16H10/20 分类号: G16H10/20;G06F17/30
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 廖元秋
地址: 100084*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及基于转化医学分析平台的临床数据集成技术数据导入方法,属于数据集成技术领域;该方法用于文本型的数据的导入和用于源数据库中数据的导入:包括准备数据文件、列映射文件、文本替换文件、及用于构建概念树的文件;构建概念树,验证列映射文件中的数据是否满足设定的规则,第一次读取并处理数据,加入自定义变量的标识后再次构造概念树;将病人ID、来访ID数据、病人信息数据导入到平台数据库并对数据异常、网络异常或平台数据库系统异常进行相关处理。该方法的特点包括在tranSMART Batch基础上在内存中构建概念树,增加自定义变量,实现直接从数据库读入数据;增加异常处理机制,使其具有自动化程度高、适应能力强的特点。
搜索关键词: 基于 转化 医学 分析 平台 临床 数据 集成 技术 导入 方法
【主权项】:
1.一种基于转化医学分析平台的临床数据集成技术数据导入方法,其特征在于,该方法用于文本型的数据的导入,具体包括以下步骤:步骤一:准备文件,准备的文件包括:11)数据文件:即要导入到平台的数据文件,文件中第一行是表头行,用于对数据说明;从第二行开始,每一行代表一条数据,行中每个具体数据以制表符’/t’分隔;数据文件还包括数据值一列对应不同的概念的数据,但对应不同的概念的数据;12)列映射文件:列映射文件有固定的六列内容;分别为数据文件的文件名、数据列号、这个数据是否可以是空值、数据变量、数据类型、数据单位;其中数据变量就是用来描述数据含义的;数据变量的取值为预先定义的符号或者是代表着一个概念的概念路径;概念由概念路径和概念类型构成;概念路径是一个将概念以斜线分隔的文本;还包括在数据变量中增加一个自定义的标识,体现一行中存在多个概念的数据变量的层级关系;13)文本替换文件:用于是将一些不符合预定义规范的数据清洗掉;该文件由四列,分别为文件名、数据列的列号、原来的值、想要替换成的值;14)用于构建概念树的文件:该文件有概念路径和概念类别两列,概念路径将概念分为不同层级,不同层级之间以斜线“\”分隔,概念类别包括类别型和数值型两类;步骤二:根据步骤一中构建的概念树文件的概念路径和概念类别中的层级,构建概念树;将概念树中的每个节点中的概念路径与概念类型插入到平台数据库中的概念表中,将概念路径与概念类型以及节点在概念树中的相对位置插入到平台数据库的I2B2表中;步骤三:读入列映射文件,验证列映射文件中的数据是否满足设定的规则,用来保证数据的正确性的;步骤四:第一次读取并处理数据:首先根据文本替换文件中的定义将该数据替换成规范的值;然后对数据的正确性验证;补充数据的缺失信息;提取出病人的ID信息即在列映射文件中该列的数据变量为‘PAT_ID’的数据,以及来访的ID数据即在列映射文件中该列的数据变量为‘VIS_ID’的数据;加入自定义变量的标识;根据自定义标识的概念路径变量构造概念路径;根据自定义标识的概念类型变量构造概念类型;再次构造概念树,并将该概念树插入到平台数据库对应的表中;步骤五:将病人ID、来访ID数据导入到平台数据库并第二次读取数据文件中的数据:按行读取这些数据,根据文本替换文件中的定义,将指定列的不符合要求的数据替换成符合要求的数据;根据列映射文件中定义的列序号以及数据变量,标识出每条数据中的每个数据的具体表示含义,将病人信息数据与病人ID对应插入到平台数据库中的病人信息表中,将来访数据与来访ID对应插入到平台数据库中的来访信息表中,将数据变量中的概念类型的变量标识的数据与概念路径本身以及在列映射文件中定义的其他类型的数据单位、数据类型相关数据插入到平台数据库中的观测事实表中;如果导入数据出现异常情况,只做相关记录供以后查看;如果是网络异常或平台数据库系统异常,则回滚事物,并记录当前导入的状态;即完成数据导入。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610947256.2/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top