[发明专利]基于网络传播的蛋白质功能预测方法在审
申请号: | 201911369728.0 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111145830A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 胡赛;赵碧海;熊慧军;王皓鋆 | 申请(专利权)人: | 长沙学院 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 安化县梅山专利事务所 43005 | 代理人: | 潘访华 |
地址: | 410022 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 传播 蛋白质 功能 预测 方法 | ||
本发明公开了一种基于网络传播的蛋白质功能预测方法,包括以下步骤:根据蛋白质相互作用网络拓扑结构建立无向加权网络,并将无向加权网络表征为无向图邻接矩阵M;根据蛋白质结构域信息和蛋白质复合物信息计算得到初始传播距离矩阵MI;根据无向图邻接矩阵M和初始传播距离矩阵MI,迭代地计算蛋白质间的网络传播距离以得到网络传播矩阵MP;根据网络传播矩阵MP逐步添加与测试蛋白质的邻接节点构成功能模块,多个功能模块构成候选功能列表;对候选功能列表中的候选功能评分、排序,选择排名靠前的若干项功能注释测试蛋白质。本发明改进了蛋白质功能预测方法研究中多源生物数据的融合方式,降低了相互作用网络中假阳性和假阴性对预测造成的负面影响,大大提高了蛋白质功能预测的准确率。
技术领域
本发明涉及蛋白质功能预测技术领域,具体涉及一种基于网络传播的蛋白质功能预测方法。
背景技术
蛋白质功能的准确注释是从分子水平理解生命的关键,对生物医学和制药产生巨大的影响。随着很多物种基因组测序工作的完成,序列数据与他们功能注释之间的差异日益增大。UniProt数据库中有功能注释的序列数据不足14%,序列数据还在成倍增长。早期预测蛋白质功能都是基于实验方法,如基因敲除,有针对性的突变与基因表达的抑制等。这些实验方法需要付出大量的实验成本和人力成本,也不适合注释蛋白质的重要部分,从而使得序列与功能之间的差距日益扩大。因此,提出高效的蛋白质功能注释的计算方法成为人们关注的热点问题之一。
目前蛋白质功能预测的计算方法大致可以分为基于序列结构的方法、基于网络的方法和多元生物信息融合的方法三种。
(1)基于序列结构的方法
早期的计算方法大都基于蛋白质氨基酸序列相似性或编码基因融合原理以及蛋白质系统发生谱研究。Henning等首先将GO注释应用于他们的GOblet的BLAST搜索结果,Groth只是简单地将序列匹配到有向无环图表示的GO。虽然没有结合相似分数,用户可以直观地了解有多少个序列匹配到共同的GO条目。Zehetner通过加权检索的GO条目列表,将这种匹配扩展到OntoBlast方法。Khan等提出的GOFigure方法和Martin等提出的GOtcha方法采用了相似的加权方式或排名方案,但是所有的分值从GO条目传播到GO DAG中的父条目层次。任何预测GO条目的最后分数根据各自的贡献被归一化。Stavros等使用SSP(序列相似性概要)将蛋白质与一组带注释的训练蛋白质进行比较,提出了两种新的LSDR方法,一种是基于GO结构的LSDR方法,另一种是基于术语语义相似性的LSDR方法。
(2)基于网络的方法
通过分析蛋白质间的相互作用,利用已有的蛋白质功能信息,根据未知蛋白质与已知蛋白质间的关联性来注释未知的蛋白质。Schwikowski等提出NC(neighbor counting)方法,将在邻居蛋白质中出现次数最多的功能预测为蛋白质的功能。Hishigaki等利用卡方统计量对待测蛋白质的近邻蛋白质中功能出现的次数进行评估,用期望出现的次数和实际出现的次数的差异来预测蛋白质是否具有某一功能。Chua等调查分析功能相似性与网络距离的联系,他们关注蛋白质的一级和二级邻居,设计了一种功能相似性计算方法,根据与目标蛋白质的距离为不同的蛋白质赋予不同的权值。
Vazquez等为每一个未注释的蛋白质赋予一个功能,使得连接相同功能蛋白质(未注释或已注释)的边数量最大。Karaoz等采用一种局部搜索程序轮流地搜索每一个节点,直至全部覆盖。节点的状态将根据大部分邻居的状态而改变,这个过程保证至少一半得到最优。Sun等也使用了类似的方法,只是他们使用了不同的目标函数和求解方法。Brun等提出基于蛋白质距离的PRODISTIN算法,采用BioNJ算法产生层次化的功能树,并进一步创建了在线的功能注释工具。类似的,Samanta等采用超几何分布计算P-value值来度量蛋白质间的距离,而预测功能时则仍采用多数表决的方法。Nabieva等提出一种相关的方法,将功能注释问题描述为一个多路切割问题。
(3)多元生物信息融合的方法
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙学院,未经长沙学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911369728.0/2.html,转载请声明来源钻瓜专利网。