[发明专利]一种基因组代谢网络模型自动化修正方法有效
| 申请号: | 201510131784.6 | 申请日: | 2015-03-24 |
| 公开(公告)号: | CN104699997B | 公开(公告)日: | 2017-05-10 |
| 发明(设计)人: | 张梁;吴晓红;薛卫;李由然;李赢;丁重阳;石贵阳 | 申请(专利权)人: | 江南大学 |
| 主分类号: | G06F19/12 | 分类号: | G06F19/12 |
| 代理公司: | 无锡华源专利商标事务所(普通合伙)32228 | 代理人: | 林弘毅,聂汉钦 |
| 地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基因组 代谢 网络 模型 自动化 修正 方法 | ||
技术领域
本发明属于生物信息学领域,具体涉及一种使用计算机挖掘生物信息数据及利用图像处理算法和权重打分机制的对基因组代谢网络模型自动化修正方法。
背景技术
随着基因组高通量测序数据的涌现,以及大量的生物学数据的产生,基因组代谢网络模型构建成为研究的热点之一。代谢网络构建是一个花费大量人力和时间的过程,因此大量的自动化构建的工具应运而生。通常这些自动化工具侧重关注代谢网络粗模型的构建和模拟过程,只有少量的自动化工具是针对代谢网络模型的修正过程。目前能够提供代谢网络模型自动化精炼过程的工具有Model SEED、Pathway Tools、RAVEN和SuBliMinaL。
代谢网络的模型构建包括粗模型的构建、模型的精炼、数学模型的准换、模型的验证预测4个过程。一个高质量的代谢网络模型,必须达到模型模拟结果和生物实际生长表型一致,否则必须要不断的重复精炼修正过程,直到模拟与表型一致。模型的精炼修正无疑是代谢网络模型构建过程中最耗时耗力的过程,少量的模型精炼工具也不能真正实现真菌代谢网络模型精炼过程的自动化。模型的精炼过程必须包括代谢漏洞的填补,反应方向的确定,反应区间定位等。Model SEED和Pathway Tools只能提供原核生物的代谢网络模型的精炼自动化过程,不能提供反应区间的定位。RAVEN和SuBliMinaL基于Wolf PSORT蛋白区间预测数据库的基础上能够实现自动化定位反应区间,但是Wolf PSORT只是一个基于氨基酸组成为特征的蛋白质在线数据库。研究表明,蛋白质区间定位在基于氨基酸组成、二肽和物理化学特性这3种特征杂合时,预测结果更准确。
发明内容
为了解决上述问题,本发明公开了一种更加省时、方便,且所得修正模型更为全面、准确的基因组代谢网络模型自动化修正方法。
本发明的技术方案如下:
一种基因组代谢网络模型自动化修正方法,包括以下步骤:
(1)、根据基因组代谢网络模型中的漏洞代谢物列表,填补物种的特异性反应;
(2)、根据物种的特异性反应中代谢物名称,确定模型中反应的方向;
(3)、确定模型中最佳反应区间。
其进一步的技术方案为,步骤(1)包括:
(1A)、使用matlab软件,将基因组代谢网络粗模型转化为计算机可读格式,并进行代谢物漏洞查找;
(1B)、向KEGG网站的自动注释服务器KASS提交物种的基因组蛋白序列,KASS自动注释返回该蛋白序列发生的Pathway list;
(1C)、在粗模型中确定漏洞代谢物的反应途径,并在步骤(1B)中得到的Pathway list中找到该反应途径;
(1D)、根据步骤(1C)中找到的漏洞代谢物的反应途径得到基因代谢网络的图谱的URL地址,向URL地址发送http请求,得到服务器端响应的网页图片记为图谱T,图谱T中包括代谢途径方框;
(1E)、点击步骤(1D)中图谱T的代谢途径方框,进入包含所有反应的页面page,页面page中包括蛋白序列的EC号,每一个EC号对应图谱T中的一个具体反应,EC号的URL地址指向具体的反应方程式;
(1F)、获取EC号在页面page中所对应的KO号和具体的反应方程Reaction,新建文件KO-EC-Reaction.txt,将EC号和与之对应的KO号、反应方程Reaction写入文件KO-EC-Reaction.txt;
(1G)、按行读取步骤(1F)中文件KO-EC-Reaction.txt的内容,循环遍历,提取KO-EC-Reaction文件中包含漏洞代谢物的反应,新建文件EC-KO-Break.txt,将包含漏洞代谢物的EC号,KO号,反应方程Reaction的信息保存在文件EC-KO-Break.txt中;
(1H)、确定步骤(1G)提取的包含漏洞代谢物的反应是否是该基因组的特异性反应;
(1I)、新建new-rec.txt文件,将特异性反应保存到new-rec.txt文件中,遍历new-rec.txt文件中的每一个反应,查看粗模型中是否存在该反应,不存在则添加。
其进一步的技术方案为,所述步骤(1H)具体包括以下步骤:
(1H1)、通过网络爬虫技术,提交并分析步骤(1E)的页面page,提取KO号在网页中对应的所有坐标;
(1H2)、定位到KO号所在的方形框后选取框内的像素点,读取其颜色的RGB值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510131784.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:个人信息保护方法及保护装置
- 下一篇:一种分裂指叉指换能器性能的计算方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





