[发明专利]一种癌症驱动基因识别方法及系统在审

专利信息
申请号: 202211240155.3 申请日: 2022-10-11
公开(公告)号: CN115762631A 公开(公告)日: 2023-03-07
发明(设计)人: 魏丕静;周舒利;郑春厚;苏延森 申请(专利权)人: 安徽大学
主分类号: G16B20/20 分类号: G16B20/20;G16B20/50;G16B40/00;G06F18/25;G06N20/20;G06F18/2415;G06F18/2411;G06F18/2431
代理公司: 合肥市长远专利代理事务所(普通合伙) 34119 代理人: 黄亚厚
地址: 230000 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 癌症 驱动 基因 识别 方法 系统
【说明书】:

一种癌症驱动基因识别方法及系统,方法为:S1、收集正常样本与肿瘤样本的多组学数据,计算出组学特征值和网络结构特征值;S2、将处理后的组学特征值和网络结构特征值进行拼接,构建新的融合特征;另外使用集成学习的方法建立模型,使用序列前向选择策略对模型的第一层分类器进行筛选,第二层分类器采用逻辑回归对第一层分类器的结果赋予权重;S3、将新的融合特征输入到第一层的分类器,获得对应数量的分类器的预测概率;S4、将第一层的所有分类器的预测概率拼接后作为特征输入第二层的逻辑回归分类器进行拟合,最终模型输出表示基因成为驱动基因的概率。本发明同时考虑分子特征和网络结构特征,并克服了单个分类器性能偏差问题。

技术领域

本发明属于癌症驱动基因识别的技术领域,尤其涉及一种癌症驱动基因识别方法及系统。

背景技术

作为全球第二大常见死因,癌症每年导致超过800万人死亡,预计未来几十年癌症发病率将增加50%以上。体细胞中发生多种基因突变,如单核苷酸变异、结构变异、插入和缺失和拷贝数改变,但大多数突变是随机的。这些对细胞没有功能影响的随机突变被称为乘客突变。还有少数突变增加了细胞相对于其邻居的选择性生长优势,并允许它自行繁殖和侵入其他组织。这些突变可能促进癌症的发生和发展,它们被称为驱动突变。携带驱动突变的基因被认为是驱动基因。一些不含突变但表达异常的基因如果能促进癌症的发展,也可能是驱动基因。在这项发明中,本申请主要关注突变的驱动基因。

随着生物数据中信息量的不断增加,越来越多的计算方法可以从基因组数据中准确定位与癌症因果关系相关的基因,这推动了癌症驱动基因的综合鉴定取得了重大进展。基于频率的方法通过研究其突变特征和预设背景突变率来发现癌症驱动基因,因为癌症驱动基因应该在不同样本中频繁变化。然而,背景突变率通常无法正确估计,基于频率的方法往往会忽略突变频率低的致癌驱动基因。基于网络的方法评估了生物网络中的遗传基因,最后通过评估基因在网络中的作用来区分驱动基因,例如DriverNet、CBNA、NetSig等方法,在网络层面识别癌症基因并揭示其分子机制,但结果依赖于所使用的网络方法。

随着近年来的发展,机器学习(ML)已成功应用于几个重大的生物医学问题,特别是,机器学习方法因其在生物信息学领域的多项预测任务中的出色表现而受到越来越多的关注。值得注意的是,在许多处理高维数据的机器学习方法中,集成方法通常优于个体分类方法。因此,需要一种基于集成学习的方法来准确的识别癌症驱动基因。

发明内容

为能够同时考虑分子特征和网络结构特征,避免单个分类器性能偏差的问题,提高癌症驱动基因的识别准确性,为此,本发明提出了一种癌症驱动基因识别方法及系统,具体方案如下:

一种癌症驱动基因识别方法,包括以下步骤:

S1、收集正常样本与肿瘤样本的多组学数据,计算出组学特征值和网络结构特征值,所述组学特征值包括差异表达值、差异甲基化值、基因突变频率值、蛋白质-蛋白质相互作用网络数据;

S2、将处理后的组学特征值和网络结构特征值进行拼接,构建新的融合特征;另外使用集成学习的方法建立模型,使用序列前向选择策略对模型的第一层分类器进行筛选,第二层分类器采用逻辑回归对第一层分类器的结果赋予权重;

S3、将新的融合特征输入到第一层的分类器,获得对应数量的分类器的预测概率;

S4、将第一层的所有分类器的预测概率拼接后作为特征输入第二层的逻辑回归分类器进行拟合,最终模型输出表示基因成为驱动基因的概率。

具体地说,所述多组学数据包括差异表达值、差异甲基化、基因突变频率值和蛋白质-蛋白质相互作用网络数据;其中基因的表达值、DNA甲基化值和基因突变数据来自TCGA数据库,蛋白质-蛋白质相互作用网络数据来自Consensus Path DB数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211240155.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top