[发明专利]一种基于时间线的病历文本医学知识发现方法在审

申请号：	201710101225.X	申请日：	2017-02-24
公开（公告）号：	CN106909783A	公开（公告）日：	2017-06-30
发明（设计）人：	陈东华;张润彤;朱晓敏	申请（专利权）人：	北京交通大学
主分类号：	G06F19/00	分类号：	G06F19/00
代理公司：	北京卫平智业专利代理事务所(普通合伙)11392	代理人：	董琪
地址：	100044 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	为了解决当前电子病历中非结构化文本难以用于诊疗预测和决策的问题，本发明提供一种基于时间线的病历文本知识发现方法，包括以下步骤构建病历样本库，用于存储结构化后的文本数据；构建病历时间文本规则库；构建包含疾病、药品和不良反应的医学知识库；对病历文本按句式拆分；使用语义分析工具进行词性标注；标注时间名词并进行根据时间先后对病历文本中拆分的文本块重新进行排序；依据医学知识库标注文本中的药品、疾病和不良反应；对文本中词语组合，提取其中患者的生理化验指标和事件。本发明帮助医学研究者更容易地发现病历文本中的医学知识。
搜索关键词：	一种基于时间病历文本医学知识发现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于时间线的病历文本医学知识发现方法，其特征包括以下步骤：(1)构建病历样本库，用于存储电子病历中原始病历文本、词性标记后的文本、时间信息标记后的文本和知识发现后的文本，以XML格式存储；(2)构建病历时间文本规则库，描述时间信息的使用正则表达式进行描述；(3)构建相关医学知识库，本方法包括疾病知识、药品知识和药品不良反应库三种库；(4)对病历样本库中的病历文本按句式进行拆分；其中，一个句子根据逗号拆分成若干个文本块。(5)使用语义分析工具对拆分后的文本块进行分词和词性标注；(6)词性标注后的各个词语进行时间规则的匹配，找出时间名词，存储时间名词；(7)根据时间信息的先后，从句子的层次重新对文本的句子进行排序，构建基于时间线的XML文本结构；对于模糊的时间文本，进行确定时间的修正。(8)依据医学知识库，从已经标注词性的文本中进行二次标注，将其中的药品、疾病知识和不良反应进一步标注出来；(9)从文本块中取连续两个词、三个词或n个词，提取中其中的生理指标和事件信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京交通大学，未经北京交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710101225.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学，即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真，例如：概率模型或动态模型，遗传基因管理网络，蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的，例如：进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的，例如：结构排序，结构或功能关系，蛋白质折叠，结构域拓扑，用结构数据的药靶，涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的，例如：基因型–表型关联，不均衡连接，种群遗传学，结合位置鉴定，变异发生，基因型或染色体组的注释，蛋白质相互作用或蛋白质核酸的相互作用

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于时间线的病历文本医学知识发现方法在审

专利文献下载