[发明专利]一种基于图模型的蛋白质复合物识别方法在审

申请号：	201611099607.5	申请日：	2016-12-02
公开（公告）号：	CN106778063A	公开（公告）日：	2017-05-31
发明（设计）人：	林志杰	申请（专利权）人：	上海电机学院
主分类号：	G06F19/18	分类号：	G06F19/18
代理公司：	上海申汇专利代理有限公司31001	代理人：	翁若莹,吴小丽
地址：	201100 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于图模型的蛋白质复合物识别方法，将给定物种的蛋白质互作网络视为网络图G＝(V，E)，V是蛋白质结点，E是蛋白质相互作用边的集合，从所有的边的集合中去掉网络中自连接边和重复边；首先获取蛋白质复合物的核蛋白顶点集，然后扩展其边缘结点一阶邻居，形成图模型；再根据图模型的特征，判别其连通性，找到所有的稠密子图，即蛋白质复合物。本发明提供的方法将图模型看作蛋白质复合物的核，通过考察扩展该图模型的一阶邻居结点识别蛋白质复合物；将本发明提供的算法应用于已知的酵母蛋白质网络，实验结果表明，本算法能够识别出比较多的具有生物意义的蛋白质复合物，且算法对输入参数不敏感。
搜索关键词：	一种基于模型蛋白质复合物识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于图模型的蛋白质复合物识别方法，其特征在于：该方法由以下步骤组成：步骤1：概念定义将给定物种的蛋白质互作网络视为网络图G＝(V，E)，V是蛋白质结点，E是蛋白质相互作用边的集合，从所有的边的集合中去掉网络中自连接边和重复边；为从蛋白质互作网络G中发现所定义的蛋白质复合物，首先定义如下概念：定义1 HP‑vertices给定蛋白质互作网络G＝(V，E)，H‑index结点代表HP‑vertices蛋白质集合，定义为HP＝v：v V，d(v)≥h，假如此时|HP|＝h，v(V/H)，d(v)≤h；HP‑vertices蛋白质集合包括h个蛋白，这h个蛋白的度至少为h；从HP‑vertices扩展至概念HP‑neighbors；其中，v是代表蛋白质结点，d(v)是结点v的度，v(V/H)是度为H的蛋白质结点；H‑index，又称为H指数或H因子，是一种评价学术成就的新方法。H代表“高引用次数”，一名科研人员的H指数是指他至多有H篇论文分别被引用了至少H次；定义2 HP‑neighborsHP‑neighbors定义为HP‑vertices蛋白质集合的一阶邻居的集合；定义3 HP‑graph蛋白质互作网络G的子图HP‑graph由HP‑vertices和它的Hp‑neighbors，除去一阶邻居HP‑neighbors之间的边；对于一个蛋白质互作网络，HP‑graph从一个原始蛋白质互作网络里分离出来有可能是一个非连通子图，因此从非连通子图HP‑graph中分离出所有的子图，最终得到的蛋白质互作网络的所有子图为所要识别的蛋白质复合物；定义4 HP‑complex如果HP‑graph是非连通的，HP‑complex定义为HP‑graph的所有子图；所有从HP‑graph中分离的子图都是想要找到的蛋白质复合物；步骤2：获取蛋白质复合物的核蛋白HP‑vertices顶点集，扩展其边缘结点一阶邻居HP‑neighbors，形成HP‑graph图模型；步骤3：判别HP‑graph的连通性，找到所有的稠密子图，即蛋白质复合物。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海电机学院，未经上海电机学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611099607.5/，转载请声明来源钻瓜专利网。

上一篇：出芽短梗霉基因组尺度代谢网络模型及其应用
下一篇：无参转录组自动化分析方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学，即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真，例如：概率模型或动态模型，遗传基因管理网络，蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的，例如：进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的，例如：结构排序，结构或功能关系，蛋白质折叠，结构域拓扑，用结构数据的药靶，涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的，例如：基因型–表型关联，不均衡连接，种群遗传学，结合位置鉴定，变异发生，基因型或染色体组的注释，蛋白质相互作用或蛋白质核酸的相互作用

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于图模型的蛋白质复合物识别方法在审

专利文献下载