[发明专利]一种基于主题模型的胸部X光片诊断报告异常检测方法有效
申请号: | 201911321745.7 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111145854B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 黄青松;殷宁波;尤诚诚;刘利军;冯旭鹏 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G16H15/00 | 分类号: | G16H15/00;G06F40/295;G06F40/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 模型 胸部 诊断 报告 异常 检测 方法 | ||
本发明涉及一种基于主题模型的胸部X光片诊断报告异常检测方法,属于计算机自然语言处理技术领域。本发明首先根据诊断报告自身特性提出了基于LSTM‑CRF模型进行诊断报告的实体抽取;然后依据领域知识和模板将诊断报告进行有效的特征扩展,缓解数据稀疏问题;利用改进的LDA模型得到影像描述和诊断结论这两种诊断报告的实例主题分布;通过计算比较影像描述实体和诊断结论实体得到的实例主题分布是否匹配,就能用来检测异常诊断报告;本发明的检测准确率高。
技术领域
本发明涉及一种基于主题模型的胸部X光片诊断报告异常检测方法,属于计算机自然语言处理技术领域。
背景技术
胸部X光片是患者胸部检查的优先选择,对患者的诊断治疗起着重要的作用。医生依据自身的经验和习惯书写胸部X光片诊断报告,诊断报告核心的内容是影像描述和诊断结论,这两部分是辅助医生诊断和患者治疗的重要参考,也是用于诊断报告异常检测的关键信息。医生书写诊断报告具有相当大的主观性,有可能会因为经验不足或疲劳而产生影像描述内容的解读错误,使一些疾病漏诊,误诊。另外诊断报告中影像所见部分描述自由,多为医疗惯例描述语言,复杂的影像描述内容,也可能影响医生的鉴别诊断,得出错误的诊断结论。筛选出这些异常的诊断报告,首先可以减少疾病误诊率,为临床医生的诊断治疗,提供更准确有效的参考。其次,为建立规范化的医疗检查体系和实现高效精准的医疗服务提供了基础。最后,增强医院的管理水平,监督考察医疗工作者的技术素养。所以,对诊断报告进行异常检测方法的研究意义重大。传统的异常检测方法都是为了找出不满足规则和期望的样本。目前在医疗领域出现了大量的异常检测方法用于检测医疗保险记录,医疗处方等医疗数据。有监督的异常检测方法,首先通过大量高质量的人工标注数据,利用传统的分类方法,找出异常类别的数据。传统的有监督检测,异常点检测,上下文异常检测等方法检测异常诊断报告效果不佳。由于缺乏有效的标注数据,诊断报告不适用于有监督的检测方法。诊断报告文本描述自由,一些影像描述的症状或者疾病出现较少,但不能归为异常,所以异常点检测会出现偏差。诊断报告数据高维稀疏,通过传统的映射函数进行上下文的特征匹配,效果不佳。
诊断报告中的诊断结论是根据影像描述得到的,影像描述中的症状实体与诊断中的结论实体存在特有的语义信息和对应关系。诊断报告中存在大量的专业术语,如果不进行实体的抽取,直接以字符或者词语特征进行训练,输入特征就会失去原有的语义信息和对应关系。如:影像描述中的“双侧膈肌光滑,双肋膈角锐利”对应结论中的“膈无异常”,分成字符或词语就失去了原有的语义信息和对应关系。通过计算这两类实体之间的对应关系是否成立,就可以判断该诊断报告影像描述与诊断结论是否匹配,既可以检测该诊断报告是否异常。
发明内容
本发明提供了一种基于主题模型的胸部X光片诊断报告异常检测方法,用于提高实体提取的效果、缓解了特征稀疏的问题、取得很好的检测识别效果。
本发明的技术方案是:一种基于主题模型的胸部X光片诊断报告异常检测方法,所述方法的具体步骤如下:
Step1、诊断报告实体抽取:诊断报告核心的内容是影像描述和诊断结论,根据诊断报告自身特性提出了基于LSTM-CRF模型进行诊断报告的实体抽取;
Step2、实体特征扩展补充:将Step1中抽取的实体进行特征扩展和补充,并将诊断的性质加入结论部分,并与影像描述中的症状实体进行匹配;
Step3、诊断报告异常检测:利用改进的LDA模型得到影像描述和诊断结论这两种诊断报告的实例主题分布;
Step4、特征匹配得出结论:通过计算比较影像描述实体和诊断结论实体得到的实例主题分布是否匹配,就能用来检测异常诊断报告。
进一步地,所述步骤Step1的具体步骤如下:
Step1.1、以字符基本特征结合诊断报告特有的实体后缀特征,生成表示其类型的字嵌入向量;解决了未登录词过多的问题,减少分词带来的负面影响,并且结合症状实体和疾病实体的字符特级征,对诊断报告中较长实体的识别,取得了很好的效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911321745.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:苯并噁嗪树脂的单体、苯并噁嗪树脂及其制备方法
- 下一篇:一种全自动封膜机