[发明专利]一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法在审
申请号: | 202310404611.1 | 申请日: | 2023-04-17 |
公开(公告)号: | CN116417070A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 赵龙;司呈坤;刘娇 | 申请(专利权)人: | 齐鲁工业大学(山东省科学院) |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/00;G06F18/2113;G06F18/243;G06F18/2411;G06N3/048;G06N3/084 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 孙倩文 |
地址: | 250353 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 梯度 提升 深度 特征 选择 算法 提高 胃癌 预后 预测 精度 方法 | ||
本发明涉及一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法,属于生物医学技术领域。包括以下步骤:从TCGA上下载胃癌患者的转录组学数据集以及临床数据,进行数据预处理;采用一致性聚类方法结合PAC和临床相关数据决策出最佳的亚型数,用于区分不同亚型;采用改进的梯度提升深度特征选择算法进行特征选择;采用深度神经网络进行分类。本发明采用无监督聚类方法,无需事先指定聚类的簇,并提出了选用PAC和临床数据来辅助决策最优亚型数,有效提高了预后预测准确率。
技术领域
本发明涉及一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法,属于生物医学技术领域。
背景技术
胃癌是最常见的癌症之一,发病率和死亡率都极高。目前,在医学界,对癌症的治疗会根据癌症种类和癌症进程选择不同的治疗方案。癌症是一种包含了多种亚型的异质性疾病,同一类的癌症又可根据发病机制的不同而细分为不同的亚型。传统临床上,通常根据癌症分期、分级等临床特征判断癌症的亚型。随着高通量实验技术的不断进步,基于癌症样本的分子组学的信息来进一步的划分癌症的亚型成为生物医学方面的研究热点。
由于基因组学数据的高维小样本特性,研究中要选用特征选择方法降维。通过特征选择方法,去除与目标函数呈弱相关的特征。同时去除噪声及冗余属性,提高后续相关算法的计算速度。这不仅会保留原始特征的生物学意义,还会提高预测准确率。
Rustam Z等人为了证明特征选择会提供更高的准确性,比较了没有特征选择和有特征选择的数据集之间的分类准确性。具体参见:Rustam Z,Maghfirah N.Correlatedbased SVM-RFE as feature selection for cancer classification using microarraydatabases[C]//AIP Conference Proceedings.AIP Publishing LLC,2018,2023(1):020235.大量学者研究如何进行高效的特征选择,Pang S等人提出了一种基于单个基因的异质性评分来识别癌症亚型的特征选择方法:HSSG。具体参见:Pang S,Wu W,Zhang Y,etal.HSSG:Identification of Cancer Subtypes Based on Heterogeneity Score of ASingle Gene[J].Cells,2022,11(15):2456.在特征选择之后,对样本进行正确分类也是关键的一步,Hui Jiang等人使用SVM对胃癌患者分类。具体参见:Jiang H,Gu J,Du J,etal.A21-gene Support Vector Machine classifier and a 10-gene risk score systemconstructed for patients with gastric cancer[J].Molecular medicine reports,2020,21(1):347-359.
虽然相关研究已经取得了相当大的成果,但仍有许多不足。比如相比于癌症分类,对于癌症亚型分型领域的相关研究较少,且现存特征选择方法所选择的重要基因在胃癌分型上分类精度普遍偏低(同一分类网络情况下)。
发明内容
为了解决现有技术的不足,本发明提供一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法,采用无监督聚类方法,无需事先指定聚类的簇,并提出了选用PAC和临床数据来辅助决策最优亚型数,有效提高了预后预测准确率。
本发明的技术方案为:
一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法,包括以下步骤:
(1)从TCGA上下载胃癌患者的转录组学数据集以及临床数据,进行数据预处理;
(2)采用一致性聚类方法结合PAC和临床相关数据决策出最佳的亚型数,用于区分不同亚型;
(3)采用改进的梯度提升深度特征选择算法进行特征选择;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学(山东省科学院),未经齐鲁工业大学(山东省科学院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310404611.1/2.html,转载请声明来源钻瓜专利网。