[发明专利]基于bagging算法的乳腺癌预测系统有效

专利信息
申请号: 202110203468.0 申请日: 2021-02-23
公开(公告)号: CN112927795B 公开(公告)日: 2022-09-23
发明(设计)人: 余之刚;何勇;刘丽媛;考春雨;王斐;杨芙;范叶叶 申请(专利权)人: 山东大学
主分类号: G16H50/20 分类号: G16H50/20;G16H50/70
代理公司: 济南联合竟成知识产权代理事务所(普通合伙) 37371 代理人: 田相迪
地址: 250000 *** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 bagging 算法 乳腺癌 预测 系统
【说明书】:

发明属于乳腺癌预测技术领域,尤其涉及基于bagging算法的乳腺癌预测方法,病例‑对照数据收集:基于乳腺癌防治相关知识设计调查问卷,问卷包含被认为对乳腺癌有影响的特征变量,通过该问卷收集来自中国三省一市25‑70岁122058名女性的乳腺疾病流行病学研究数据,记录病例‑对照数据备份,数据处理:对问卷收集来的数据进行数据清洗,删除重复信息以及缺失值或异常值过多的无效样本和特征变量。该基于bagging算法的乳腺癌预测方法,通过集成学习建立了一个有效的预测乳腺癌患病风险的模型,帮助医护人员预测处于乳腺癌的患者,及时并准确地对高危人群采取针对性的措施,这将有助于乳腺癌的辅助诊断和预防,为智能诊断作出贡献。

技术领域

本发明涉及乳腺癌预测技术领域,具体为基于bagging算法的乳腺癌预测系统。

背景技术

恶性肿瘤(癌症)已经成为严重威胁中国人群健康的主要公共卫生问题之一,其中乳腺癌为女性癌症之首。全球乳腺癌发病率自20世纪70年代末开始一直呈上升趋势。由于地区分布不均衡,乳腺癌防控形势严峻,防治难度巨大。因此,筛查重要影响因素,建立乳腺癌风险评估模型,预测乳腺癌发生概率,对乳腺癌的防治具有重要意义。常用乳腺癌风险模型包括:BOADICEA、BRCAPRO、BCRAT和IBIS。BOADICEA基于2785个家系进行更新,分离出537个BRCA1或BRCA2突变,能够针对多基因多癌症进行风险评估。BRCAPRO模型基于301个BRCA基因突变检测家族的数据,对基因外显功能进行了调整,充分考虑了家族史的重要性,但是忽略了Gail模型涉及的非家族史信息。Gail模型在1989年首次提出,是目前最为精确、权威、常用的乳腺癌风险评估模型。BCRAT模型即为改良Gail模型,目前也被美国癌症研究所(NCI)采用,作为乳腺癌风险评估工具模型。IBIS模型也称Tyrer-Cuzick模型,能够评估具有非典型增生的女性未来10年发展为乳腺癌的概率,但在个体层面上不能明确区分是否发生浸润性乳腺癌,显著高估了非典型妇女乳腺癌的风险。由于基因序列检测成本较高,考虑到医疗资源有限,特别是在我国农村地区,迫切需要一种适合一般人群筛查的风险预测模型。

近年来,机器学习算法在医疗领域的应用频率和研究深度增长迅速,已经有学者应用机器学习算法实现对部分疾病患病率的预测,且效果显著,集成学习是机器学习算法中较有特点的一类,它是按照将弱分类器集成为强分类器的思路来组合基础模型,集成学习模型除了在稳定性和泛化能力上相比传统模型表现突出,在最终的预测准确率上也相对较高。

疾病预测在根据真实数据建模的过程中,往往会遇到数据质量差、缺失值较多等问题,在数据预处理过程中,选择怎样的处理方式将使预测精度最高的问题;使用bagging集成学习框架并加以改进,以解决样本标签不足可能会产生的过拟合问题,并使融合后的模型较其他经典模型性能表现更好,同时筛选重要特征变量,使得预测模型在不损失预测精度的前提下得以简化,降低计算的复杂度。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了使用bagging集成学习框架并加以改进,以解决样本标签不足可能会产生的过拟合问题,并使融合后的模型较其他经典模型性能表现更好的问题,同时筛选重要特征变量,使得预测模型在不损失预测精度的前提下得以简化,降低计算的复杂度等优点,解决了疾病预测在根据真实数据建模的过程中,往往会遇到数据质量差、缺失值较多等问题,在数据预处理过程中,选择怎样的处理方式将使预测精度最高的问题。

(二)技术方案

为实现上述预测模型在不损失预测精度的前提下得以简化、降低计算的复杂度等目的,解决疾病预测在根据真实数据建模的过程中,往往会遇到数据质量差、缺失值较多等问题,本发明提供如下技术方案:基于bagging算法的乳腺癌预测系统,包括处理单元,处理单元执行以下步骤:

S1、病例-对照数据收集

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110203468.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top