[发明专利]一种基于AC自动机的疾病症状提取方法在审
申请号: | 201811201375.9 | 申请日: | 2018-10-16 |
公开(公告)号: | CN109524068A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 李继云;王天磊;孙莉;俞捷;林靖生;乐嘉锦 | 申请(专利权)人: | 东华大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F17/22 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;吴小丽 |
地址: | 200050 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于AC自动机的疾病症状提取方法,步骤1:使用症状词语字典构造字典树;步骤2:进行失败指针的构造,实现AC自动机算法;步骤3:将电子病历信息转换成UTF‑8的编码格式;步骤4:利用AC自动机算法对电子病历信息中的症状词语进行匹配;如果完整地匹配,做好标记并提取出该症状词语,同时继续往下读电子病历信息,直到读到终止符号;步骤5:如果匹配了一个及以上的字,但没能成功匹配,沿症状字典树中该位置的父结点向上取失败结点,并进入步骤4。本发明能够对非结构化电子病历中的症状词语进行有效且快速的提取,从而有助于药物不良反应的自动监测方面的研究,有助于实现药物不良反应自发呈报系统的设计与优化。 | ||
搜索关键词: | 电子病历信息 匹配 词语 药物不良反应 疾病症状 字典树 算法 编码格式 电子病历 非结构化 自动监测 父结点 失败 结点 字典 指针 转换 优化 成功 研究 | ||
【主权项】:
1.一种基于AC自动机的疾病症状提取方法,其特征在于,该方法由以下5个步骤组成:步骤1:使用症状词语字典构造字典树;步骤2:进行失败指针的构造,实现AC自动机算法;步骤3:将电子病历信息转换成UTF‑8的编码格式;步骤4:利用AC自动机算法对电子病历信息中的用药不良反应所产生的症状词语进行匹配;如果在电子病历信息中完整地匹配了症状词语字典中的症状词语,做好标记并提取出该症状词语,同时继续往下读电子病历信息,直到读到终止符号;步骤5:如果匹配了一个及以上的字,但没能成功匹配,沿字典树中该位置的父结点向上取失败结点,并进入步骤4。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811201375.9/,转载请声明来源钻瓜专利网。