[发明专利]用于智能疾病筛查的临床决策支持方法及系统有效
申请号: | 201810496358.6 | 申请日: | 2018-05-22 |
公开(公告)号: | CN108766559B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 丁帅;杨善林;胡世康 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30;G16H50/70 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 智能 疾病 临床 决策 支持 方法 系统 | ||
本发明提供一种用于智能疾病筛查的临床决策支持方法及系统,该疾病筛查模型能够提升疾病筛查的准确率,减小误分类代价。该方法包括:对检查报告进行后结构化处理,得到样本数据集;根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型;至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到疾病筛查模型,所述疾病筛查模型的输入为检查报告,输出为疾病分类结果,所述疾病分类结果用于支持临床决策。
技术领域
本发明涉及医疗技术领域,具体地,涉及一种用于智能疾病筛查的临床决策支持方法及系统。
背景技术
传统上对癌症(例如胃癌,乳腺癌等)的诊断和筛查依靠医生对病历以及检查报告的分析。而由于日趋沉重的工作压力、冗长的病历和检查报告,对医生的工作效率产生较大的影响,以及癌症的诊断筛查工作本身的难度和基层医生自身专业水平的限制,导致对癌症的筛查存在较高的误诊率和漏诊率。
随着近年来人工智能技术的进步,数据驱动的分析研究逐渐成为临床和生物学领域癌症相关研究的有力支持和补充,使得疾病的筛查逐渐趋向智能化。例如,相关技术中运用集成学习方法,分析了超过140万名糖尿病患者的数据,在检测视网膜病变(DR)的易感性方面具有很高的准确性,同时,解决了视网膜病筛查依从性低的问题。又例如,将癌症的合并症纳入到癌症的诊断和治疗研究中,考虑使用准确率、灵敏度和特异性作为模型性能的评估指标,但是,却忽略了癌症相关数据集不平衡导致的准确率等指标使用局限的情况。
通常情况下,使用机器学习方法建立的分类模型不可避免地存在泛化误差,并且分类阈值选取的不同,会带来灵敏度、特异性等不同方面的误差损失。这种误差损失在胃癌筛查问题中表现为误诊和漏诊,即错误地将无癌样本判断为有癌和错误地将有癌样本判断为无癌,前者会带来进一步的检查困难,后者则可能引发医疗事故。
临床上,误诊和漏诊所造成的代价损失是不均等的,但是,如何降低误分类代价,提高疾病筛查准确率,本领域技术人员未做进一步考虑。
发明内容
本发明实施例提供一种用于智能疾病筛查的临床决策支持方法及系统,该疾病筛查模型能够提升疾病筛查的准确率,减小误分类代价。
为了实现上述目的,本发明第一方面提供一种用于智能疾病筛查的临床决策支持方法,所述方法包括:
对检查报告进行后结构化处理,得到样本数据集;
根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型;
至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到所述疾病筛查模型。
可选地,所述至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到所述疾病筛查模型,包括:
设定一分类阈值,并将发生疾病概率大于所述分类阈值的确定为患病样本,将发生疾病概率小于所述分类阈值的确定为正常样本;
每设定一分类阈值后,根据如下公式计算在该分类阈值下的误分类代价lcost:
lcost=α*FPR+β*(1-TPR);
其中,α为误诊代价系数,β为漏诊代价系数;TPR=TP/(TP+FN)为真正例率,TP为正确预测的患病样本数,FN为错误预测的患病样本数;FPR=FP/(FP+TN)代表患病样本的误诊率,FP为错误预测的无疾病本数,TN为正确预测的无疾病本数;1-TPR代表患病样本的漏诊率;
选取使得误分类代价lcost具有最小值的分类阈值作为所述疾病筛查模型的目标分类阈值。
可选地,所述至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到所述疾病筛查模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810496358.6/2.html,转载请声明来源钻瓜专利网。