[发明专利]基于多源数据融合及多目标优化的蛋白质复合物识别方法在审
申请号: | 201711190016.3 | 申请日: | 2017-11-24 |
公开(公告)号: | CN108009403A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 朱媛;彭晓宇;吴崇 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F19/24 | 分类号: | G06F19/24;G06F19/18;G06F19/12 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 龚春来 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 融合 多目标 优化 蛋白质 复合物 识别 方法 | ||
1.基于多源数据融合及多目标优化的蛋白质复合物识别方法,其特征在于,包括以下步骤:
S1.将蛋白质相互作用网络看成是全连通图,预处理,得到邻接矩阵;
S2.将邻接矩阵中的所有蛋白质节点进行聚类,得到初步的蛋白质聚类模块;
S3.在初步的蛋白质聚类模块的基础上进一步优化每一个聚类模块,在优化过程中融合蛋白质相互作用网络数据的拓扑结构特性和GO注释数据的功能相似特性,并结合自适应多目标黑洞优化算法框架进行寻优操作,将每个蛋白质模块看作黑洞,每个蛋白质节点看作星点,黑洞中心是初始粗聚类模块的聚类中心,通过选择和删除不同于原个体的新星点来不断更新黑洞,计算新黑洞与原星点所在黑洞的适应值,进行比较,若新黑洞的适应值优于原有的黑洞,则用新产生的黑洞替代原有的黑洞,得到蛋白质复合物模块;
S4.进行后处理,去除在每个蛋白质复合物模块中与其他蛋白质节点没有相连接边的孤立节点,并去除所有规模小于3的蛋白质复合物模块,经过处理得到的蛋白质复合物模块即为该方法识别的最优蛋白质复合物。
2.如权利要求1所述的基于多源数据融合及多目标优化的蛋白质复合物识别方法,其特征在于,所述步骤S1中,邻接矩阵通过以下方法得到:
S1.1.获取蛋白质相互作用数据库;
S1.2.去除冗余的蛋白质,保留具有相互作用的蛋白质列表对,将两列取并集,得到完整的蛋白质列表;
S1.3.通过MATLAB仿真软件处理得到能反映相互作用关系的邻接矩阵。
3.如权利要求1所述的基于多源数据融合及多目标优化的蛋白质复合物识别方法,其特征在于,所述步骤S3中,在初步的蛋白质聚类模块的基础上进一步优化每一个聚类模块的具体步骤为:黑洞的初始化策略、多源数据融合策略、星点的添加和删除策略。
4.如权利要求3所述的基于多源数据融合及多目标优化的蛋白质复合物识别方法,其特征在于,所述黑洞的初始化策略的具体方法为:借鉴biclustering算法的思想,分别对邻接矩阵的行和列执行K-means聚类操作,即在蛋白质相互作用网络中所有节点中选择K个聚类中心,比较其余节点到各个聚类中心的距离,将其归入到最近的聚类中心所在的模块中,得到初始的K个蛋白质复合物模块。
5.如权利要求3所述的基于多源数据融合及多目标优化的蛋白质复合物识别方法,其特征在于,所述多源数据融合策略的主要方法为:结合蛋白质相互作用网络的拓扑结构特性和GO注释数据的功能相似特性,通过整合不同类型的基因组数据和蛋白质相互作用数据,作为多目标优化策略中的目标函数,引导最优解的不断迭代过程。
6.如权利要求5所述的基于多源数据融合及多目标优化的蛋白质复合物识别方法,其特征在于,所述多目标优化策略中的目标函数设定的具体方法为:结合蛋白质相互作用网络的拓扑结构特性和GO注释数据的功能特性,在充分考虑各个目标之间互斥性的前提下选择合适的目标函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711190016.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业咨询服务系统装置
- 下一篇:圆管钻孔夹具
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置