[发明专利]一种基于时间线的病历文本医学知识发现方法在审

专利信息
申请号: 201710101225.X 申请日: 2017-02-24
公开(公告)号: CN106909783A 公开(公告)日: 2017-06-30
发明(设计)人: 陈东华;张润彤;朱晓敏 申请(专利权)人: 北京交通大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 北京卫平智业专利代理事务所(普通合伙)11392 代理人: 董琪
地址: 100044 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 为了解决当前电子病历中非结构化文本难以用于诊疗预测和决策的问题,本发明提供一种基于时间线的病历文本知识发现方法,包括以下步骤构建病历样本库,用于存储结构化后的文本数据;构建病历时间文本规则库;构建包含疾病、药品和不良反应的医学知识库;对病历文本按句式拆分;使用语义分析工具进行词性标注;标注时间名词并进行根据时间先后对病历文本中拆分的文本块重新进行排序;依据医学知识库标注文本中的药品、疾病和不良反应;对文本中词语组合,提取其中患者的生理化验指标和事件。本发明帮助医学研究者更容易地发现病历文本中的医学知识。
搜索关键词: 一种 基于 时间 病历 文本 医学知识 发现 方法
【主权项】:
一种基于时间线的病历文本医学知识发现方法,其特征包括以下步骤:(1)构建病历样本库,用于存储电子病历中原始病历文本、词性标记后的文本、时间信息标记后的文本和知识发现后的文本,以XML格式存储;(2)构建病历时间文本规则库,描述时间信息的使用正则表达式进行描述;(3)构建相关医学知识库,本方法包括疾病知识、药品知识和药品不良反应库三种库;(4)对病历样本库中的病历文本按句式进行拆分;其中,一个句子根据逗号拆分成若干个文本块。(5)使用语义分析工具对拆分后的文本块进行分词和词性标注;(6)词性标注后的各个词语进行时间规则的匹配,找出时间名词,存储时间名词;(7)根据时间信息的先后,从句子的层次重新对文本的句子进行排序,构建基于时间线的XML文本结构;对于模糊的时间文本,进行确定时间的修正。(8)依据医学知识库,从已经标注词性的文本中进行二次标注,将其中的药品、疾病知识和不良反应进一步标注出来;(9)从文本块中取连续两个词、三个词或n个词,提取中其中的生理指标和事件信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710101225.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top