[发明专利]一种基因组代谢网络模型自动化修正方法有效

专利信息
申请号: 201510131784.6 申请日: 2015-03-24
公开(公告)号: CN104699997B 公开(公告)日: 2017-05-10
发明(设计)人: 张梁;吴晓红;薛卫;李由然;李赢;丁重阳;石贵阳 申请(专利权)人: 江南大学
主分类号: G06F19/12 分类号: G06F19/12
代理公司: 无锡华源专利商标事务所(普通合伙)32228 代理人: 林弘毅,聂汉钦
地址: 214122 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基因组 代谢 网络 模型 自动化 修正 方法
【说明书】:

技术领域

发明属于生物信息学领域,具体涉及一种使用计算机挖掘生物信息数据及利用图像处理算法和权重打分机制的对基因组代谢网络模型自动化修正方法。

背景技术

随着基因组高通量测序数据的涌现,以及大量的生物学数据的产生,基因组代谢网络模型构建成为研究的热点之一。代谢网络构建是一个花费大量人力和时间的过程,因此大量的自动化构建的工具应运而生。通常这些自动化工具侧重关注代谢网络粗模型的构建和模拟过程,只有少量的自动化工具是针对代谢网络模型的修正过程。目前能够提供代谢网络模型自动化精炼过程的工具有Model SEED、Pathway Tools、RAVEN和SuBliMinaL。

代谢网络的模型构建包括粗模型的构建、模型的精炼、数学模型的准换、模型的验证预测4个过程。一个高质量的代谢网络模型,必须达到模型模拟结果和生物实际生长表型一致,否则必须要不断的重复精炼修正过程,直到模拟与表型一致。模型的精炼修正无疑是代谢网络模型构建过程中最耗时耗力的过程,少量的模型精炼工具也不能真正实现真菌代谢网络模型精炼过程的自动化。模型的精炼过程必须包括代谢漏洞的填补,反应方向的确定,反应区间定位等。Model SEED和Pathway Tools只能提供原核生物的代谢网络模型的精炼自动化过程,不能提供反应区间的定位。RAVEN和SuBliMinaL基于Wolf PSORT蛋白区间预测数据库的基础上能够实现自动化定位反应区间,但是Wolf PSORT只是一个基于氨基酸组成为特征的蛋白质在线数据库。研究表明,蛋白质区间定位在基于氨基酸组成、二肽和物理化学特性这3种特征杂合时,预测结果更准确。

发明内容

为了解决上述问题,本发明公开了一种更加省时、方便,且所得修正模型更为全面、准确的基因组代谢网络模型自动化修正方法。

本发明的技术方案如下:

一种基因组代谢网络模型自动化修正方法,包括以下步骤:

(1)、根据基因组代谢网络模型中的漏洞代谢物列表,填补物种的特异性反应;

(2)、根据物种的特异性反应中代谢物名称,确定模型中反应的方向;

(3)、确定模型中最佳反应区间。

其进一步的技术方案为,步骤(1)包括:

(1A)、使用matlab软件,将基因组代谢网络粗模型转化为计算机可读格式,并进行代谢物漏洞查找;

(1B)、向KEGG网站的自动注释服务器KASS提交物种的基因组蛋白序列,KASS自动注释返回该蛋白序列发生的Pathway list;

(1C)、在粗模型中确定漏洞代谢物的反应途径,并在步骤(1B)中得到的Pathway list中找到该反应途径;

(1D)、根据步骤(1C)中找到的漏洞代谢物的反应途径得到基因代谢网络的图谱的URL地址,向URL地址发送http请求,得到服务器端响应的网页图片记为图谱T,图谱T中包括代谢途径方框;

(1E)、点击步骤(1D)中图谱T的代谢途径方框,进入包含所有反应的页面page,页面page中包括蛋白序列的EC号,每一个EC号对应图谱T中的一个具体反应,EC号的URL地址指向具体的反应方程式;

(1F)、获取EC号在页面page中所对应的KO号和具体的反应方程Reaction,新建文件KO-EC-Reaction.txt,将EC号和与之对应的KO号、反应方程Reaction写入文件KO-EC-Reaction.txt;

(1G)、按行读取步骤(1F)中文件KO-EC-Reaction.txt的内容,循环遍历,提取KO-EC-Reaction文件中包含漏洞代谢物的反应,新建文件EC-KO-Break.txt,将包含漏洞代谢物的EC号,KO号,反应方程Reaction的信息保存在文件EC-KO-Break.txt中;

(1H)、确定步骤(1G)提取的包含漏洞代谢物的反应是否是该基因组的特异性反应;

(1I)、新建new-rec.txt文件,将特异性反应保存到new-rec.txt文件中,遍历new-rec.txt文件中的每一个反应,查看粗模型中是否存在该反应,不存在则添加。

其进一步的技术方案为,所述步骤(1H)具体包括以下步骤:

(1H1)、通过网络爬虫技术,提交并分析步骤(1E)的页面page,提取KO号在网页中对应的所有坐标;

(1H2)、定位到KO号所在的方形框后选取框内的像素点,读取其颜色的RGB值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510131784.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top