[发明专利]一种基于BSO优化的蛋白质复合物识别方法有效

专利信息
申请号: 201510097724.7 申请日: 2015-03-05
公开(公告)号: CN105590039B 公开(公告)日: 2018-04-24
发明(设计)人: 沈显君;胡小华;何婷婷;杨进才 申请(专利权)人: 华中师范大学
主分类号: G06F19/24 分类号: G06F19/24
代理公司: 湖北武汉永嘉专利代理有限公司42102 代理人: 张惠玲
地址: 430079 湖北省武*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 bso 优化 蛋白质 复合物 识别 方法
【权利要求书】:

1.一种基于BSO优化的蛋白质复合物识别方法,其特征在于,包含有如下步骤:

首先进行分组操作,将整个PPI网络看成是全连通网络,结合蛋白质拓扑距离和GO功能注释信息集定义节点间的距离,将所有的蛋白质节点进行聚类,得到初步的蛋白质聚类模块;借鉴K-means算法的思想:在所有节点中选择出k个初始聚类中心,比较其余节点到各个聚类中心的距离,将其归入到最近的聚类中心所在的模块中,得到初始的k个模块;

然后创造新蛋白质模块,结合蛋白质相互作用网络的拓扑特性,改进BSO算法创造新个体的过程,对初始聚类结果进行优化;将每个蛋白质模块看作一个群,每个蛋白质节点看作为一个个体,群中心则是初步聚类模块的聚类中心;通过选择不同于原个体的新个体,通过新个体产生新的群,计算新群与原个体所在群的适应值,进行比较,若新群的适应值优于原有的群,则用新产生的群替代原有的群;

最后进行后期处理过程,去除在每个蛋白质复合物中与其他蛋白质节点没有相连边的孤立节点,并去除掉所有规模小于3的蛋白质模块,最后经过处理得到的蛋白质模块即为该方法识别的最优蛋白质复合物。

2.如权利要求1所述的基于BSO优化的蛋白质复合物识别方法,其特征在于,所述的蛋白质节点进行聚类的具体步骤为:候选种子的选择、初始聚类中心选择策略、形成最优聚类模块。

3.如权利要求2所述的基于BSO优化的蛋白质复合物识别方法,其特征在于,所述的候选种子的选择,是将PPI网络抽象为由蛋白质节点和节点间的交互作用所形成的网络图,每个蛋白质复合物都是从一个既定的节点开始,经过聚类操作得到一个模块;

定义1直接邻居集合:对于网络G中的每个节点i,其直接邻居集合为:

Neigh(i)={j∈V|(i,j)∈E}

定义2节点的聚类系数:对于一个节点i,令ni表示节点i的Neigh(i)个邻居中具有相互连接的个数,则节点i的聚类系数为:

NCCi=2×ni|Neigh(i)|×(|Neigh(i)|-1)]]>

一个节点的聚类系数是直接邻居节点间所拥有的边数和Neigh(i)个节点间可能构成的最大边数的比值,节点i的聚类系数反映的是该节点的局部密度;

候选种子节点的选择方式为:首先计算每个节点聚类系数,然后比较每个节点的聚类系数与已经设定的阈值ω,将聚类系数值大于阈值的节点加入到候选种子节点集合seed中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510097724.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top