[发明专利]一种基于AC自动机的疾病症状提取方法在审

专利信息
申请号: 201811201375.9 申请日: 2018-10-16
公开(公告)号: CN109524068A 公开(公告)日: 2019-03-26
发明(设计)人: 李继云;王天磊;孙莉;俞捷;林靖生;乐嘉锦 申请(专利权)人: 东华大学
主分类号: G16H10/60 分类号: G16H10/60;G16H50/70;G06F17/22
代理公司: 上海申汇专利代理有限公司 31001 代理人: 翁若莹;吴小丽
地址: 200050 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于AC自动机的疾病症状提取方法,步骤1:使用症状词语字典构造字典树;步骤2:进行失败指针的构造,实现AC自动机算法;步骤3:将电子病历信息转换成UTF‑8的编码格式;步骤4:利用AC自动机算法对电子病历信息中的症状词语进行匹配;如果完整地匹配,做好标记并提取出该症状词语,同时继续往下读电子病历信息,直到读到终止符号;步骤5:如果匹配了一个及以上的字,但没能成功匹配,沿症状字典树中该位置的父结点向上取失败结点,并进入步骤4。本发明能够对非结构化电子病历中的症状词语进行有效且快速的提取,从而有助于药物不良反应的自动监测方面的研究,有助于实现药物不良反应自发呈报系统的设计与优化。
搜索关键词: 电子病历信息 匹配 词语 药物不良反应 疾病症状 字典树 算法 编码格式 电子病历 非结构化 自动监测 父结点 失败 结点 字典 指针 转换 优化 成功 研究
【主权项】:
1.一种基于AC自动机的疾病症状提取方法,其特征在于,该方法由以下5个步骤组成:步骤1:使用症状词语字典构造字典树;步骤2:进行失败指针的构造,实现AC自动机算法;步骤3:将电子病历信息转换成UTF‑8的编码格式;步骤4:利用AC自动机算法对电子病历信息中的用药不良反应所产生的症状词语进行匹配;如果在电子病历信息中完整地匹配了症状词语字典中的症状词语,做好标记并提取出该症状词语,同时继续往下读电子病历信息,直到读到终止符号;步骤5:如果匹配了一个及以上的字,但没能成功匹配,沿字典树中该位置的父结点向上取失败结点,并进入步骤4。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811201375.9/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top