[发明专利]基于IDPC和LASSO的食管鳞癌预后生存风险评估方法在审
申请号: | 202210276812.3 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114639482A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 凌丹;刘安浩;王延峰;王妍;孙军伟;栗朝松;王英聪;王立东;宋昕;赵学科 | 申请(专利权)人: | 郑州轻工业大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张真真 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 idpc lasso 食管 预后 生存 风险 评估 方法 | ||
本发明提出了一种基于IDPC和LASSO的食管鳞癌预后生存风险评估方法,其步骤为:首先,获取食管鳞癌患者的病理数据,利用卡方检验方法和信息增益确定的重要病理因素构建决策树,将患者分为早期组和中晚期组;其次,分别获取早期组和中晚期组食管鳞癌患者的术前血常规生化指标,利用LASSO选择出与术后生存风险显著相关的指标;然后,利用IDPC将早期组和中晚期组食管鳞癌患者分别聚集成不同的集群,对每一个集群,构建基于LR的列线图以预测食管鳞癌患者的生存风险;最后,利用混淆矩阵和受试者的AUC对列线图的性能进行评估。本发明较为准确地判断食管鳞癌患者的预后生存风险,可以帮助医生做出诊断决定,以至于为患者提供有效治疗。
技术领域
本发明涉及食管鳞癌风险评估技术领域,特别是指一种基于IDPC和LASSO的食管鳞癌预后生存风险评估方法。
背景技术
美国癌症联合委员会提出的TNM分期系统已广泛应用于食管鳞癌患者的预后预测。然而,食管鳞癌的发病机制复杂,仅使用TNM分期系统诊断食管鳞癌患者的生存风险存在一些局限性。内窥镜检查确定也可以确定食管鳞癌患者的生存风险,但这对患者来说是昂贵的。根据临床病理检查和血常规检查信息对生存风险进行分类是计算机辅助系统面临的一项挑战。近年来,许多机器学习方法被用于预测食管鳞癌患者的预后生存时间,例如神经网络、支持向量机和随机森林。然而,用户难以发现机器学习方法建立的非线性模型的内部结构,并且不能发现指标的重要性。同时,生物信息的特征提取和聚类方法是国内外研究学者的难题。当今的医学界需要一种能够方便直观的发现影响食管鳞癌预后生存风险的指标因素和准确判断预后风险的方法。
发明内容
针对上述背景技术中存在的不足,本发明提出了一种基于IDPC和LASSO的食管鳞癌预后生存风险评估方法,解决了现有预测模型的内部结构不清晰、指标变量筛选不全和预测能力低的技术问题。
本发明的技术方案是这样实现的:
一种基于IDPC和LASSO的食管鳞癌预后生存风险评估方法,其步骤如下:
步骤一:获取食管鳞癌患者的病理数据;
步骤二:使用食管鳞癌患者的病理数据,利用卡方检验方法和信息增益确定的重要病理因素构建决策树,将患者分为早期组和中晚期组;
步骤三:分别获取早期组和中晚期组食管鳞癌患者的术前血常规生化指标,利用最小绝对收缩和选择算子选择出与术后生存风险显著相关的指标;
步骤四:利用基于余弦距离和K近邻的改进密度峰值聚类算法将早期组和中晚期组食管鳞癌患者分别聚集成不同的集群;
步骤五:对每一个集群,构建基于逻辑回归模型的列线图以预测食管鳞癌患者的生存风险;
步骤六:利用混淆矩阵和受试者操作特性曲线下面积对步骤五中的列线图的性能进行评估。
优选地,所述食管鳞癌患者的病理数据包括性别、年龄、肿瘤大小、分化程度、浸润程度和淋巴结转移。
优选地,所述卡方检验方法为:
其中,mi和mj分别代表变量数和样本数,i表示变量的取值,j表示食管鳞癌患者样本取值,Aij表示某变量取值为i且属于第j个食管鳞癌患者样本的实际值,Tij表示变量取值为i且属于第j个食管鳞癌患者样本的期望值,其中Tij定义如下:
优选地,所述信息增益的计算方法为:
其中,gr表示信息增益率,△H为属性的信息增益,InfoBefore(H)为属性分类前的信息熵;信息增益△H的计算方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学,未经郑州轻工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210276812.3/2.html,转载请声明来源钻瓜专利网。