[发明专利]一种可追溯的病历分类方法有效

专利信息
申请号: 202110010118.2 申请日: 2021-01-04
公开(公告)号: CN112699241B 公开(公告)日: 2022-08-26
发明(设计)人: 张伯政;吴军;樊昭磊;何彬彬;桑波 申请(专利权)人: 山东众阳健康科技集团有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/216;G06K9/62;G16H10/60
代理公司: 济南泉城专利商标事务所 37218 代理人: 支文彬
地址: 250001 山东省济南市市辖区*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 追溯 病历 分类 方法
【说明书】:

一种可追溯的病历分类方法,通过使用语言模型,对病历中所有文字的上下文信息进行语义整合,最终通过门控机制,压制无意义文字对分类结果的影响,提升了分类模型中间数据的信噪比,继而提升了病历文本的分类准确度。同时对分类结果有意义的文字得以通过门控值进行追溯。最终实现了高准确率的病历分类的同时,输出文字的门控值,并通过文字的门控值实现了病历分类的文字依据的追溯。

技术领域

发明涉及一种医疗信息处理技术领域,具体涉及一种可追溯的病历分类方法。

背景技术

病历的分类对于当前医疗卫生统计以及疾病编码质控以及DRGs和医保审核等等领域都有着非常广泛的应用。但现如今,病历的分类无法做到百分百准确,而医疗行业又由于其严谨性等特征,所以如何能够对分类的病历文本中的判据进行追溯,继而提升人在使用病历分类的后继产品时的人机协同体验显得尤为重要。传统的病历分类方法主要有两种技术方案:

基于统计语言处理的方法:例如TF-IDF、BM25、N-GRAM、隐语义分析、主题模型等等,这些方法共同的特点,是从统计学的角度出发,抽取出病历文本中的文本特征信息,并将文本特征信息使用统计学分类模型,例如逻辑回归、KNN、SVM等等模型,或者是使用MLP等深度学习模型,针对病历文本中抽取出来的特征信息进行分类。这些方法有很多明显短板:1.在通过统计语言处理方法来抽取病历文本特征的时候,破坏了原来文本的序列结构,虽然分类的过程解释性较强,但是病历的特征与病历文本信息仅仅存在统计学意义上的相关,并不存在一一对照的相关性,所以无法追溯。2.由于基于统计语言处理的方法抽取的病历文本的文本特征皆流于字面的统计,无法深入到每个字的语义层面的信息,所以分类的准确度不高。

基于深度学习的方法:该类方法使用深度神经网络,例如CNN、RNN、Transformer等等,对文本进行分类,虽然其分类准确度较高,但由于深度学习方法属于明显的黑盒机制,且近期有很多的文献以及研究指出,深度学习的追溯尤其是基于Attention机制的追溯都存在无法解释等问题,虽然可以采取例如敏感性分析等等方法进行追溯,但是此类方法只能够对文本中的单字进行追溯,追溯过程中无法结合全文信息。

所以设计一种可以在对病历进行高准确度的分类的同时,能够对文本中的分类判据信息进行精准追溯的方法显得尤为关键。

发明内容

本发明为了克服以上技术的不足,提供了一种对病历进行高准确度分类且能对文本中的分类判据信息进行精准追溯的病历分类方法。

本发明克服其技术问题所采用的技术方案是:

一种可追溯的病历分类方法,包括:

a)获取病历数据,将其表示为集合{(D1,L1),(D2,L2),...,(Dn,Ln)},集合中有n个数据,D1为第1个数据中的病历文本,L1为第1个数据中的病历文本对应的类别标签,所有标签中类别个数为m;

b)随机初始化可训练的标签嵌入矩阵,表示为K,该矩阵大小为m行h列;

c)使用预训练好的语言模型,输入一个病历文本,将其输出的数据表示为矩阵U,其大小为l行h列;

d)随机初始化一个多层感知机,表示为MLP1,其输入维度为h,其输出维度为1;

e)通计算得到每个字的门控值矩阵G,矩阵G为一个l行m列的矩阵,其第i行j列的值表示模型在做预测时,病历中的第i个字在对第j个类别作预测时的相关度;

f)通过计算得到模型预测结果概率矩阵矩阵为一个m行l列的矩阵,每行的数值表示该病历输入该行对应的类别的概率;

g)计算最终的损失值loss;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众阳健康科技集团有限公司,未经山东众阳健康科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110010118.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top