[发明专利]对重构基因组尺度代谢网络进行模块划分的方法有效
申请号: | 201410692571.6 | 申请日: | 2014-11-27 |
公开(公告)号: | CN104376233B | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 郝彤;于爱玲;孙金生 | 申请(专利权)人: | 天津师范大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 天津市杰盈专利代理有限公司12207 | 代理人: | 朱红星 |
地址: | 300387 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种对重构基因组尺度代谢网络进行模块划分的方法。主要包括创建反应图、根据分类树初步解耦网络和网络解耦的优化内容。本发明所采用的方法结合了层次式聚类方法和非层次式聚类方法的优势,通过聚类树的生成得到代谢网络的层次结构,符合生物代谢网络的层次性,之后通过模块化指标的优化,得到最佳的解耦结果。从而兼顾了网络的层次性和模块性,即符合了生物网络本身的特点,又在结构上得到了最优的解耦结果。 | ||
搜索关键词: | 基因组 尺度 代谢 网络 进行 模块 划分 方法 | ||
【主权项】:
一种对重构基因组尺度代谢网络进行模块划分的方法,其特征在于按如下的步骤进行:(1)创建反应图:(a)去除代谢网络中的流通代谢物和孤立反应,所述的流通代谢物指的是在细胞全局范围内流通的代谢物;其中所述的流通代谢物指的是ATP,ADP, phosphate,diphosphate,NADP, NADPH,CO2,NAD,NADH, O2;孤立反应指的是不与任何其他反应相连接的反应;(b)根据每个反应的代谢物连接将网络转化为反应图:如果反应A的生成物与反应B反应物相同,则可建立反应A到反应B的单向连接,可表示为A‑>B;当同时存在A‑>B及B‑>A的两个连接时,则可将这两个连接合并为一个双向连接A<‑>B;(2)根据分类树初步解耦网络:网络的解耦及优化利用pajek软件和python软件程序包实现;(a)利用pajek软件将反应分为若干弱连接体,弱连接体是指一个有向网络的任意节点对之间都存在无向路径的无向图;(b)基于路径长度构建最大弱连接体的分类树:首先计算最大弱连接体中任意两个节点之间的最短路径长度,再根据最短路径长度构建距离矩阵,最后根据距离矩阵决定分类树的结构,从而构建最大弱连接体的分类树,该步骤是利用python软件的preOrdertree工具包完成;(c)设定分解后模块大小的最大值,即每个模块中包含叶节点数的最大值;(d)对于第(b)步绘制的分类树,从根节点开始由上至下、由左至右遍历树的各个分支,当一个分支所包含的叶节点数小于第(c)步设定的最大值时,停止对该分支下其他分支的搜索并将该分支下的所有叶节点存为一个模块,通过这种方法将整个分类树中的所有叶节点划分到不同的模块中,完成网络的初步解耦;(3)网络解耦的优化(a)一次优化:将初步解耦的结果中包含的VSC合并到其他模块中,其中,VSC为初步解耦网络中含有的节点数少的非常小的模块;①设定VSC包含的最大反应数,从而确定网络中的VSC;② 查找与其相连的其他模块并计算这些模块与VSC之间的连接数;③ 将VSC合并到与其连接数最多的模块中,当网络中有多个模块与VSC具有相同的连接数时,将VSC合并到包含节点数最少的模块中;④ 对所有VSC重复上述过程直至将所有VSC合并到其他模块中;(b) 二次优化:根据模块化指标对一次优化的结果进行再次优化处理;① 设定最终模块数,对于每个模块找到与之相连的所有模块;② 当网络中的两个模块合并时,合并后的模块化指标会有所变化,其变化量的计算公式为:其中ΔQ为正时则表明模块合并后网络模块性增强,分解变得更为合理,其正值越大则表示合理性越高;计算与模块A相连的所有模块分别与模块A合并时整个网络的ΔQ;其中是模块到模块之间连接边数占网络总边数分数的一半;是模块到模块之间连接边数占网络总边数分数的一半;是与模块中节点连接的所有边的末端;是与模块中节点连接的所有边的末端;i和j分别代表两个不同模块;③ 选取ΔQ具有最大正值的模块,将该模块与模块A合并,当网络中有多个模块与模块A具有相同的ΔQ时,选取包含节点数最少的模块与模块A合并;④ 一次合并行为发生后,重新创建合并后的模块列表,并对新的模块列表从第一个模块开始重新执行①‑③步,当达到最终模块数量并且搜索到最后一个模块仍然没有可以发生合并行为时,优化过程终止,得到最终的模块划分结果;(4)解耦完成:得到最终的模块划分结果;将所述方法用在中华绒螯蟹‑眼柄重构基因组尺度代谢网络的模块划分中,所采用的模型是中华绒螯蟹‑眼柄重构基因组尺度代谢网络,包含1304个反应,去掉流通代谢物后有联系的反应为1053个,首先用pajek软件将代谢网络分成若干个弱连接体,通过弱连接体计算将网络解耦为66个弱连接体,其中包含10个以上反应的较大弱连接体仅有6个,最大弱连接体包含774个反应,占代谢网络总反应数的74%;在弱连接体计算的基础上,应用所述方法对最大弱连接体进行解耦;解耦过程中,参数设定如下:绘制分类树后,初步解耦模块大小最大值设为50;一次优化中,VSC模块大小最大值设为10;二次优化中,最终模块数设为10;经过解耦最终得到16个模块,最大模块包含90个反应,最小模块中包含10个反应,共用时间4.641975秒。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津师范大学,未经天津师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410692571.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种自动清洁LED路灯
- 下一篇:一种LED模组
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用