[发明专利]基于多源数据融合及多目标优化的蛋白质复合物识别方法在审

专利信息
申请号: 201711190016.3 申请日: 2017-11-24
公开(公告)号: CN108009403A 公开(公告)日: 2018-05-08
发明(设计)人: 朱媛;彭晓宇;吴崇 申请(专利权)人: 中国地质大学(武汉)
主分类号: G06F19/24 分类号: G06F19/24;G06F19/18;G06F19/12
代理公司: 武汉知产时代知识产权代理有限公司 42238 代理人: 龚春来
地址: 430074 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 融合 多目标 优化 蛋白质 复合物 识别 方法
【说明书】:

发明公开了基于多源数据融合及多目标优化的蛋白质复合物识别方法,包括对蛋白质相互作用网络数据进行预处理,得到邻接矩阵;蛋白质复合物初步聚类,得到初始蛋白质复合物模块;进一步优化复合物模块,在优化过程中融合蛋白质相互作用网络数据的拓扑结构特性和GO注释数据的功能相似特性,并结合自适应多目标黑洞优化算法框架进行寻优操作,得到更加精确的蛋白质复合物模块;进行后处理操作,得到最终的最优蛋白质复合物。本发明提高了蛋白质复合物的识别速度和识别精度,适用于蛋白质相互作用网络并可拓展到至其他复杂社区网络分析中,在复杂网络分析中具有很强的实用性。

技术领域

本发明涉及生物信息学领域,尤其涉及一种基于多源数据融合及多目标优化的蛋白质复合物识别方法。

背景技术

蛋白质是基因表达的产物,是生物体生理功能的执行者,也是生命现象的直接体现者。蛋白质组学是对蛋白质所含特性进行系统化研究的学科,能为生物系统在健康和疾病状态下的结构、功能和调控提供详细的描述。几乎所有的生物过程,都是通过一系列的蛋白质相互作用完成的。从系统生物学的角度,利用蛋白质相互作用网络研究和分析生物功能具有重要的前景和实用价值。

蛋白质复合物是在相同时间和空间通过相互作用组成的一个多分子机制的蛋白质集合,它是蛋白质执行其功能的主要形式。识别蛋白质复合物不仅有利于理解复杂的生命活动,同时为挖掘复杂疾病生成机理及合理的药物开发提供理论支撑。随着高通量实验技术及蛋白质组学的发展,使得人们利用网络理论的方法探究蛋白质功能、相互作用关系及挖掘复杂疾病机理成为可能。大量研究表明,蛋白质网络(生物体内所有蛋白质间的相互作用关系)具有明显的模块化结构,这些结构通常与蛋白质复合物相对应,利用蛋白质网络识别蛋白质复合物可以提高效率,并指导生物实验。但是,通过高通量测序技术得到的蛋白质相互作用数据往往具有较高的假阳性和假阴性,单一利用蛋白质相互作用数据,会影响蛋白质复合物识别的精准率。

随着生物技术的发展,多源生物数据不断涌现,如蛋白质相互作用(ProteinProtein Interaction,PPI)数据,基因本体(Gene Ontology,GO)数据、时间序列RNA-seq数据、时间序列的基因表达数据、亚细胞定位信息、疾病相关数据库等多源信息。因此,通过整合多源数据,提高蛋白质复合物的识别精度,成为备受关注的研究方向。

发明内容

有鉴于此,本发明的实施例提供了一种多源生物信息的融合策略,并结合多目标优化方法识别蛋白质复合物,最终实现蛋白质复合物的识别和预测的基于多源数据融合及多目标优化的蛋白质复合物识别方法。

本发明的实施例提供基于多源数据融合及多目标优化的蛋白质复合物识别方法,包括以下步骤:

S1.将蛋白质相互作用网络看成是全连通图,预处理,得到邻接矩阵;

S2.将邻接矩阵中的所有蛋白质节点进行聚类,得到初步的蛋白质聚类模块;

S3.在初步的蛋白质聚类模块的基础上进一步优化每一个聚类模块,在优化过程中融合蛋白质相互作用网络数据的拓扑结构特性和GO(Gene Ontology)注释数据的功能相似特性,并结合自适应多目标黑洞优化算法框架进行寻优操作,将每个蛋白质模块看作黑洞,每个蛋白质节点看作星点,黑洞中心是初始粗聚类模块的聚类中心,通过选择和删除不同于原个体的新星点来不断更新黑洞,计算新黑洞与原星点所在黑洞的适应值,进行比较,若新黑洞的适应值优于原有的黑洞,则用新产生的黑洞替代原有的黑洞,得到蛋白质复合物模块;

S4.进行后处理,去除在每个蛋白质复合物模块中与其他蛋白质节点没有相连接边的孤立节点,并去除所有规模小于3的蛋白质复合物模块,经过处理得到的蛋白质复合物模块即为该方法识别的最优蛋白质复合物。

进一步,所述步骤S1中,邻接矩阵通过以下方法得到:

S1.1.获取蛋白质相互作用数据库;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711190016.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top