[发明专利]跨粒度智能化疾病筛查系统有效
申请号: | 201810495222.3 | 申请日: | 2018-05-22 |
公开(公告)号: | CN108805178B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 丁帅;胡世康;杨善林 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H50/70 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 粒度 智能化 疾病 系统 | ||
本发明提供一种跨粒度智能化疾病筛查方法及系统,用以提升疾病筛查的全面性和准确率。该方法包括:建立多层疾病筛查模型,每一层疾病筛查模型的分类粒度不同;根据目标检查报告,依次调用每一层的疾病筛查模型,得到每一层的疾病筛查模型输出的疾病分类结果。
技术领域
本发明涉及医疗技术领域,具体地,涉及一种跨粒度智能化疾病筛查方法及系统。
背景技术
传统上对癌症(例如胃癌,乳腺癌等)的诊断和筛查依靠医生对病历以及检查报告的分析。而由于日趋沉重的工作压力、冗长的病历和检查报告,对医生的工作效率产生较大的影响,以及癌症的诊断筛查工作本身的难度和基层医生自身专业水平的限制,导致对癌症的筛查存在较高的误诊率和漏诊率。
随着近年来人工智能技术的进步,数据驱动的分析研究逐渐成为临床和生物学领域癌症相关研究的有力支持和补充,使得疾病的筛查逐渐趋向智能化。例如,相关技术中运用集成学习方法,分析了超过140万名糖尿病患者的数据,在检测视网膜病变(DR)的易感性方面具有很高的准确性,同时,解决了视网膜病筛查依从性低的问题。又例如,相关技术针对心脏病移植手术移植物存活率与预测变量的研究,使用了加权平均集成结合多个模型的预测结果,提高了模型的预测性能,取得了较好的效果。
但是,相关技术对于集成方法本身并没有进行改进,导致对模型预测性能的提升是不可控的,本领域技术人员对于如何进一步提高疾病筛查准确率未做进一步考虑。
发明内容
本发明实施例提供一种跨粒度智能化疾病筛查方法及系统,用以提升疾病筛查的全面性和准确率。
为了实现上述目的,本发明第一方面提供一种跨粒度智能化疾病筛查方法,所述方法包括:
建立多层疾病筛查模型,每一层疾病筛查模型的分类粒度不同;
根据目标检查报告,依次调用每一层的疾病筛查模型,得到每一层的疾病筛查模型输出的疾病分类结果。
可选地,采用如下方法建立每一层的疾病筛查模型:
对检查报告进行后结构化处理,得到本层分类粒度对应的样本数据集;
根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型;
至少对所述多个同质分类模型使用最优赋权加权集成方法OWIA进行加权集成,以得到一疾病筛查模型。
可选地,所述对检查报告进行后结构化处理,得到本层分类粒度对应的样本数据集包括:
以所述检查报告中的病理检查报告为准,对所述检查报告进行数据整合;
对整合后的检查报告进行特征提取,得到具有代表性以及区分度的目标数据项;
对所述目标数据项进行数值化表示,得到所述样本数据集。
可选地,所述根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型,包括:
将所述样本数据集按照预设比例划分为训练数据集和测试数据集;
从所述训练数据集中采样得到k份互有交叉的采样数据集,k为大于1 的正整数,其中,具体的采样方式可以是有放回的采样,使得采样数据集大小和原数据集大小相同;
采用同一机器学习算法,分别在所述k份训练数据集上进行模型的训练和校验,得到k个同质分类模型。
可选地,所述至少对所述多个同质分类模型使用最优赋权加权集成方法 OWIA进行加权集成,以得到一疾病筛查模型,包括:
确定所述多个同质分类模型的权重组合集合;
分别计算在所述权重组合集合中的每一权重组合下,集成模型的性能评估值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810495222.3/2.html,转载请声明来源钻瓜专利网。