[发明专利]一种通用的医疗专病数据系统的构建方法在审
申请号: | 201810282025.3 | 申请日: | 2018-04-02 |
公开(公告)号: | CN108538395A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 王淑;于广军;陈敏;魏明月;凌琦鸣;施敏华;贾蕾;赖双;武月圆;蒋蓓;姚晨龙;谢晶晶;杨俊;何俊峰;马诗诗 | 申请(专利权)人: | 上海市儿童医院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F17/30;G06F17/27 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 施浩 |
地址: | 200062 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 专病 数据系统 病历 临床数据 通用的 构建 医疗 电子病历 非结构化 疾病特征 结构化 挖掘 疾病 分析 上下文关系 语义 模式匹配 文本分析 整合结构 知识提取 异质性 分词 整合 中文 治疗 | ||
1.一种通用的医疗专病数据系统的构建方法,其特征在于,包括:
步骤1:采集临床医疗数据;
步骤2:将采集到的临床医疗数据进行数据清洗;
步骤3:对非结构化的医疗数据进行处理,处理内容包括基于中文病历的分词技术和模式识别技术完成电子病历的结构化,通过电子病历的语义解析、特征表示、特征提取,挖掘病历中疾病临床表现的转归情况;
步骤4:整合非结构化数据的处理后的临床医疗数据,结合结构化的医疗数据形成全维度的医疗专病数据,构建出医疗专病数据系统。
2.根据权利要求1所述的通用的医疗专病数据系统的构建方法,其特征在于,步骤1中采集的医疗数据包括病人基本信息、门诊处方、门诊电子病历、住院医嘱、住院诊断、住院病历、住院护理记录、病人体征信息、病人检验报告数据、病人检查报告数据、手术记录数据在内的临床医疗数据,采集手段包括通过检索临床文档数据库获取或者通过访问临床数据中心获得病人相关的临床医疗数据。
3.根据权利要求2所述的通用的医疗专病数据系统的构建方法,其特征在于,步骤2中的数据清洗是在构建的病人全息诊疗信息数据模型基础上,进行患者主索引管理、时间戳管理、检查数据一致性,完成专病数据系统的原始数据材料准备。
4.根据权利要求3所述的通用的医疗专病数据系统的构建方法,其特征在于,步骤2中的数据清洗包括四个方面的工作内容,分别是:(1)字符转换:包括统一把全角英文字符和全角数字字符转换为半角英文和数字字符,把半角标点符号转换为全角标点符号;(2)异常处理:包括去除病历文本中多余的包括空格、换行符、括号在内的符号;(3)格式统一:包括对病历文本中的阴阳性文本进行统一格式化处理;(4)常用语转换:包括对临床常用缩略语进行转换。
5.根据权利要求4所述的通用的医疗专病数据系统的构建方法,其特征在于,步骤3进一步包括:
准备材料:准备清洗过的非结构化专病病历材料;
分词处理:以专病词典、医学词典为主,配合基础词典,形成专病分词词典集,通过专病分词词典集的循环匹配完成非结构化专病病历分词;
医学词性标注:通过专病词典和医学基础词典的医学词性,标注病历结构化分词的词语词性,词性包括症状、诊断、药品、检验项目;
医学语义标注:通过专病词典中的同义词、限定词典,解析医学语义,标注病历分词后的属性词性,表示病历的症状情况;
专病指标识别:通过病历的词性和语义标注,完成检查、检验、症状、治疗和文书的专病指标解析;
数据结构化:形成结构化的专病病历数据集。
6.根据权利要求5所述的通用的医疗专病数据系统的构建方法,其特征在于,基础词典主要包括病历常用词及其使用频率信息,具有属性词性;医学词典主要包括临床诊断编码词典、身体部位解剖学词典、药品词典、检查词典、检验词典、手术词典,具有医学词性;专病词典主要包括疾病的症状字典、疾病的治疗字典、疾病的查房指标,具有专病词性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市儿童医院,未经上海市儿童医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810282025.3/1.html,转载请声明来源钻瓜专利网。