[发明专利]一种基于KRAS突变结肠癌基因的预后模型的建立方法在审
申请号: | 202210831902.4 | 申请日: | 2022-07-15 |
公开(公告)号: | CN115083608A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 张鹤;董伟伟;赵慧霞;胡琰琰;杨静文;张丰云;曾志艳;李秋文;肖文华 | 申请(专利权)人: | 中国人民解放军总医院第四医学中心 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16B5/00;G06K9/62 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 郭卫芹 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kras 突变 结肠癌 基因 预后 模型 建立 方法 | ||
1.一种基于KRAS突变结肠癌基因的预后模型的建立方法,其特征在于,包括以下步骤:
S1:数据采集与预处理:获取样本的矩阵数据及相应的临床信息;
S2:预后模型构建:基于获取的数据,进行单因素Cox分析,采用LASSO-COX回归建立预后模型;
S3:KRAS突变状态预测:使用随机森林算法对GEO队列中的KRAS突变状态进行估计;
S4:预后模型评估:分别使用内部验证和外部验证对建立的预后模型进行评估。
2.如权利要求1所述的基于KRAS突变结肠癌基因的预后模型的建立方法,其特征在于,所述矩阵数据共包括5个COAD数据集,分别为3个微阵列数据集和2个RNA-seq数据集;3个微阵列数据集分别为GSE41258数据集、GSE39582数据集和GSE17536数据集;2个RNA-seq数据集包括TCGA-COAD队列和CPTAC-COAD队列。
3.如权利要求2所述的基于KRAS突变结肠癌基因的预后模型的建立方法,其特征在于,步骤S2包括以下具体的步骤:
S201:将GSE39582中的KRAS突变样本随机化到训练集和测试集;
S202:采用最小绝对收缩和选择算子建立预后模型,并利用训练集中的“glmnet”R包采用LASSO-COX回归建立预后模型;
S203:根据所选基因的表达水平和系数计算样本的风险评分:
4.如权利要求2所述的基于KRAS突变结肠癌基因的预后模型的建立方法,其特征在于,步骤S3中,使用随机森林算法在GSE39582数据集中对GEO队列中的KRAS突变状态进行了估计。
5.如权利要求2所述的基于KRAS突变结肠癌基因的预后模型的建立方法,其特征在于,步骤S4中,使用GSE39582数据集的测试集作为内部验证,RNA-seq联合队列和GEO联合队列中KRAS突变体估计样本作为外部验证。
6.如权利要求5所述的基于KRAS突变结肠癌基因的预后模型的建立方法,其特征在于,步骤S4包括以下具体的步骤:
S401:根据风险评分公式计算每个样本的风险评分,并根据风险评分中值将每个集合中的样本分别划分为高风险组和低风险组;
S402:采用Kaplan-Meier生存分析估计和绘制高危和低危样本的生存曲线,log-rank检验两组生存时间的差异,通过“timeROC”R包进行时间依赖性ROC曲线测试计算的准确性;
S403:使用多因素分析用于评估我们的预后特征对COAD预后的独立性。采用校正曲线检验nomogram预测效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军总医院第四医学中心,未经中国人民解放军总医院第四医学中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210831902.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆的座椅调节方法、装置、车辆及存储介质
- 下一篇:一种钢质非隔热耐火窗