[发明专利]一种采用烟花算法识别蛋白质复合物的方法有效
申请号: | 201610596280.6 | 申请日: | 2016-07-26 |
公开(公告)号: | CN106228036B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 雷秀娟;王飞;程适 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 陆万寿 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种采用烟花算法识别蛋白质复合物的方法,由如下步骤组成:将蛋白质相互作用网络转化为无向图、对蛋白质相互作用网络边和结点预处理、构建动态蛋白质相互作用网络、设置参数、初始化烟花的位置、模拟烟花爆炸产生火花、从火花中选择部分较好的点作为烟花、所有烟花组成一个类、过滤不好的类、输出最终得到的类。该方法考虑了蛋白质网络的动态性、蛋白质复合物内部核心‑附件结构以及蛋白质相互作用网络的局部性和全局性,能准确地识别蛋白质复合物。仿真实验结果表明,正确率、查全率等指标性能较优。与其他聚类方法相比,结合蛋白质相互作用网络和蛋白质复合物特性,实现蛋白质复合物识别过程,提高了蛋白质复合物的识别准确率。 | ||
搜索关键词: | 一种 采用 烟花 算法 识别 蛋白质 复合物 方法 | ||
【主权项】:
1.一种采用烟花算法识别蛋白质复合物的方法,其特征在于包括以下步骤:(1)将蛋白质相互作用网络转化为无向图将最初得到的蛋白质相互作用网络转化成一个无向图,该无向图可用G=(V,E)表示,其中,V为所有蛋白质结点的集合,E为所有蛋白质相互作用边的集合;(2)对无向图中的边和结点进行预处理对点集V进行预处理:计算点集中每个结点vi的聚集系数和度,结点的度是每个结点的邻居结点的数目,结点的聚集系数可由式(1)计算得出:
式中kv是结点vi的度,nv是结点vi的kv个邻居结点相互之间的边的个数;边的聚集系数可由式(2)计算得到:
式中,Z(vi,vj)表示包含结点vi与vj的三角形个数,即两个结点的公共邻居结点的数目,di,dj分别是结点vi,vj的度;边的皮尔森相关系数可由式(3)计算得到:
式中,xi,yi表示蛋白质vx,vy在时间点t时的基因表达值,μ(x),μ(y)是蛋白质vx,vy的平均基因表达值,T为时间点的最大值;(3)构建动态蛋白质相互作用网络在时间点t时,蛋白质vx的基因表达值xi若大于基因表达阈值AT(i),则认为蛋白质vx在时间点t具有活性;一条边两端的两个蛋白质vx,vy都在时间点t 具有活性,则这条边是构成动态蛋白质相互作用网络的一条边,在时间点t存在于网络当中;通过对每个蛋白质结点都进行上述处理,在每个时间点都可以得到在该时间具有活性的蛋白质结点及边,这些结点和边在每个时间点都构成了一个子网,由全部时间点的子网所构成的一个网络就是动态蛋白质相互作用网络;(4)初始化参数令t,T分别表示当前的时间点和最大时间点,t=1;firework表示烟花结点,spark表示火花结点,fc表示一个蛋白质簇,簇的密度阈值th_core=0.7,重叠度阈值为th_os,past表示已经聚类的结点集合,temp表示剩余未聚类的结点集合,cluster是最终聚类得到的蛋白质复合物,t=1时,temp=V,cluster和past均为空集;(5)初始化烟花的位置对剩余未聚类的结点集合temp中的结点先按照点的聚集系数和度进行降序排序,其中值最大的结点作为一个初代烟花firework;(6)模拟烟花爆炸产生火花在蛋白质相互作用网络中,由烟花结点firework起,模拟烟花爆炸,经由连接烟花的相互作用向外扩散,所有与烟花相连的结点均为由它爆炸产生的火花spark;(7)从火花中选择部分较好的点作为烟花对于由烟花爆炸产生的火花spark,逐个将火花加入烟花所在的簇fc中,若加入后的簇的密度大于阈值th_core,则将此火花转换为烟花,并保存在簇中,否则将它从簇中删除,在将所有火花遍历一遍后,簇中的所有结点成为新一代烟花firework;(8)所有烟花组成一个类将簇fc中的结点从temp中删除,将fc归到cluster中,若temp为空集,则转到步骤(9),若temp不为空,则转到步骤(6);(9)过滤不好的类确定所有时间点产生的蛋白质复合物之间的重叠度OS,合并重叠度大于重叠度阈值th_os的蛋白质复合物,并删除cluster中只包含一个蛋白质结点的蛋白质复合物;(10)输出得到的类将最终的蛋白质复合物cluster输出,cluster中的每个元素均为一个蛋白质复合物,每个蛋白质复合物至少包含两个蛋白质,所有这些蛋白质复合物即为聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610596280.6/,转载请声明来源钻瓜专利网。