[发明专利]一种基于邻域子图连通性的蛋白质预测方法在审
申请号: | 201911014545.7 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110782944A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 王雷;邹赛;朱贤友;陈治平 | 申请(专利权)人: | 长沙学院;重庆电子工程职业学院 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00 |
代理公司: | 50223 重庆蕴博君晟知识产权代理事务所(普通合伙) | 代理人: | 郑勇 |
地址: | 410022 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 邻域 连通性 基因表达数据 基因表达信息 蛋白质识别 蛋白质预测 数学语言 邻接 构建 加权 蛋白质 网络 衡量 | ||
一种基于邻域子图连通性的蛋白质预测方法。本发明将基因表达信息与PPI网络相结合,提出了一种新的基于邻域子图连通性的无参数蛋白质识别方法。首先采用数学语言定义PPI网络的邻域子图,其次基于基因表达数据构建加权邻域子图,最后定义邻接子图连通性来衡量蛋白质的重要性,实验表明本发明具有很好的性能。
技术领域
本发明涉及生物信息领域,具体涉及一种基于邻域子图连通性的蛋白质预测方法。
背景技术
随着人类基因组计划的完成,蛋白质组学正成为生命科学研究的热点。蛋白质组学研究将使我们更好地了解细胞结构、细胞功能和疾病。蛋白质作为基因表达的产物,几乎参与所有的生命活动。在细胞过程中,蛋白质的研究是非常重要的。蛋白质具有不同的功能和对生命活动的重要程度也不同。关键蛋白质是通过基因敲除技术去除的蛋白,会导致机体功能丧失,引起机体致病的。关键蛋白质的鉴定可以帮助人们了解维持生命的最低基本要求。关键蛋白质的鉴定在合成生物学、药物靶点和人类疾病基因等领域具有重要意义和实用价值。
在生物学中,基本蛋白的鉴定主要是通过生物学手段,如单基因敲除、RNA干扰、条件敲除等。虽然生物实验技术具有较高的准确性,但生物实验是费时且昂贵的。随着大规模生物数据集的出现,在大规模生物数据上鉴定关键蛋白质的计算方法是另一种有效的方法,已成为研究的热点。
现有技术采用生物实验获得的生物网络往往含有假阳性数据等噪声。大多数识别基本蛋白质的算法在有噪声的背景下性能较差。
发明内容
本发明的目的在于克服现有技术的不足,提供一种有助于克服了假阳性数据等噪声的影响,提高基本蛋白质的识别率和准确率的基于邻域子图连通性的蛋白质预测方法。
本发明提供一种基于邻域子图连通性的蛋白质预测方法,包括以下步骤,
S1:采用V表示PPI网络的节点,E表示PPI网络的边,建立无向图G=(V,E),无向图的节点由蛋白质组成,无向图的边由相互作用的蛋白质的连线构成;
S2:令(u,v)表示路径上每条边的权值之和,disshortest(u,v)表示最短路径中每条边的权值之和,其中,G=(V,E),u∈V(G),v∈V(G);
S3:令所述无向图中每条边的权重为1,如果G=(V,E),u∈V(G),存在并且disshortest(u,v)=1,则确定集合{v|v∈V(G)anddisshortest(u,v)=1}内所有的节点为u的邻居节点,并且采用NeighborG(u)表示所述邻居节点;
S4:令Vw=V(G),Ew=E(G),u∈Vw,v∈Vw,,如果存在边e∈Ew,则将边e的权记为weight(u,v),获得新图Gw=(Vw,Ew),并将Gw命名为做蛋白质的加权邻接子图,将加权邻接子图表示为NeighborGw(u);
S5:采用下述计算出蛋白质u和v的联通性,
其中,ε是一个阈值;
S6:对于一个给定的蛋白质u,采用下述公式计算蛋白质的邻居子图的联通性;
\w,α,β分别为中间过程变量。
本发明提出相邻子图连通性的概念来识别关键蛋白质。通过改进传统的节点权重计算方法,将相邻子图连通性引入多蛋白节点,克服了假阳性数据等噪声的影响。
附图说明
图1为本发明一实施方式流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙学院;重庆电子工程职业学院,未经长沙学院;重庆电子工程职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911014545.7/2.html,转载请声明来源钻瓜专利网。