[发明专利]面向循证医学领域的类别检测方法有效
| 申请号: | 201910508791.1 | 申请日: | 2019-06-12 |
| 公开(公告)号: | CN110210037B | 公开(公告)日: | 2020-04-07 |
| 发明(设计)人: | 琚生根;王婧妍;熊熙;李元媛;孙界平 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06N3/04;G16H15/00 |
| 代理公司: | 北京元本知识产权代理事务所 11308 | 代理人: | 王红霞 |
| 地址: | 610065 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 医学 领域 类别 检测 方法 | ||
本发明公开一种面向循证医学领域的类别检测方法,包括以下步骤:将摘要中的每个句子分别进行ELMo与Bi‑LSTM两种处理,得到句向量;将所述句向量进行编码,得到包含有句子之间语义关系的文本表示向量;将所述文本表示向量输入CRF模型进行句子序列分类,将待分类句子和句子类别标签分别作为CRF模型的观察序列和状态序列,通过下层网络提取的句子关联特征获得每个句子的标签概率。本发明实现循证医学文本摘要类别检测,利用多连接Bi‑LSTM网络捕获句子间依赖关系与上下文信息,结合多层自注意力机制,提高了句子编码的整体质量,并且在公开的医学摘要数据集上取得了不错的效果。
技术领域
本发明涉及英文医学文本摘要的信息化处理技术领域,具体的说是一种面向循证医学领域的类别检测方法。
背景技术
循证医学(Evidence-Based Medicine,EBM)是一种临床实践方法,通过分析PubMeb等大型医学文献数据库以及检索相关临床主题文本来获取证据。EBM以论文为开端,经过人工判断进一步提炼特定问题所依赖的证据基础。EBM领域临床实践问题的定义往往遵从PICO原则,即:Population(P);Intervention(I);Comparison(C);Outcome(O)。
为完成从文章到医疗证据的转换,需要对文章摘要进行深度梳理。摘要是对医学文章内容不加注释和评论的简短陈述,要求简单扼要地说明研究工作的目的、研究方法和最终结论等。如表1所示,生物医学文章摘要中一般以无结构化展现论文研究的临床实践主题、人群、研究方法和实验结果等,由于缺乏有效的自动识别技术导致医生检索医学证据时效率低下。当摘要内容以结构化的形式出现,阅读摘要将更加简便高效。
表1标注前后对比
医学文本摘要的类别检测可以转化为摘要句子序列的分类任务。摘要的句子包含上下文信息,并且句子间存在复杂的语义和语法关联性,使得其分类问题有别于独立句子的分类问题。
在过去的研究中,临床医生对PICO标准或者其他类似模式的使用已经得到验证,而研究者也寻求更好的句子分类模型来实现类似PICO类标的自动检测。
机器学习分类方法通过事先已有的文本训练集有监督地建立分类器,节省大量的人力,且不限于特定的领域。传统机器学习方法用于临床医学序列句子分类的主要有朴素贝叶斯、支持向量机以及条件随机场等。但这些方法往往需要大量的手工构建特征,如语法特征、语义特征和结构特征等。
近几年,对于使用神经网络解决序列句子分类问题的研究层出不穷,神经网络的优点在于自动构建特征。深度学习解决文本分类问题主要通过卷积神经网络(Convolutional Neural Network,CNN)进行特征提取,再通过循环神经网络(RecurrentNeural Network,RNN)进行建模。自注意力机制不依赖于其他特征和词之间的距离,直接计算词语依赖关系,学习句子的内部结构。Yang等人提出的层级注意力机制与神经网络相结合的模型在文本分类任务上取得了不错的效果。Transformer放弃CNN和RNN,使用注意力机制和全连接层构成端到端模型,广泛应用于文本分类等多个任务。Komninos等人引入基于上下文的词向量改善句子分类性能。以ELMo(Embeddings from Language Models)、BERT(Bidirectional Encoder Representations from Transformers)为主的预训练语言模型,将生成的词向量经过微调处理,在多项自然语言处理任务上都取得了最佳效果,Howard等人构建用于文本分类的预训练语言模型。然而,以上模型都没有直接应用于医学领域。Jin等人第一次将深度学习用于循证医学类标检测任务,代表深度学习模型可以大大提升序列句子分类任务的效果,但该模型在生成句向量时忽略了摘要内句子间的关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910508791.1/2.html,转载请声明来源钻瓜专利网。





