[发明专利]一种基因组代谢网络模型自动化修正方法有效
| 申请号: | 201510131784.6 | 申请日: | 2015-03-24 |
| 公开(公告)号: | CN104699997B | 公开(公告)日: | 2017-05-10 |
| 发明(设计)人: | 张梁;吴晓红;薛卫;李由然;李赢;丁重阳;石贵阳 | 申请(专利权)人: | 江南大学 |
| 主分类号: | G06F19/12 | 分类号: | G06F19/12 |
| 代理公司: | 无锡华源专利商标事务所(普通合伙)32228 | 代理人: | 林弘毅,聂汉钦 |
| 地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基因组 代谢 网络 模型 自动化 修正 方法 | ||
1.一种基因组代谢网络模型自动化修正方法,其特征是,包括以下步骤:
(1)、根据基因组代谢网络模型中的漏洞代谢物列表,填补物种的特异性反应;
(2)、根据物种的特异性反应中代谢物名称,确定模型中反应的方向;
(3)、确定模型中最佳反应区间;
步骤(1)包括:
(1A)、使用matlab软件,将基因组代谢网络粗模型转化为计算机可读格式,并进行代谢物漏洞查找;
(1B)、向KEGG网站的自动注释服务器KASS提交物种的基因组蛋白序列,KASS自动注释返回该蛋白序列发生的Pathway list;
(1C)、在粗模型中确定漏洞代谢物的反应途径,并在步骤(1B)中得到的Pathway list中找到该反应途径;
(1D)、根据步骤(1C)中找到的漏洞代谢物的反应途径得到基因代谢网络的图谱的URL地址,向URL地址发送http请求,得到服务器端响应的网页图片记为图谱T,图谱T中包括代谢途径方框;
(1E)、点击步骤(1D)中图谱T的代谢途径方框,进入包含所有反应的页面page,页面page中包括蛋白序列的EC号,每一个EC号对应图谱T中的一个具体反应,EC号的URL地址指向具体的反应方程式;
(1F)、获取EC号在页面page中所对应的KO号和具体的反应方程Reaction,新建文件KO-EC-Reaction.txt,将EC号和与之对应的KO号、反应方程Reaction写入文件KO-EC-Reaction.txt;
(1G)、按行读取步骤(1F)中文件KO-EC-Reaction.txt的内容,循环遍历,提取KO-EC-Reaction文件中包含漏洞代谢物的反应,新建文件EC-KO-Break.txt,将包含漏洞代谢物的EC号,KO号,反应方程Reaction的信息保存在文件EC-KO-Break.txt中;
(1H)、确定步骤(1G)提取的包含漏洞代谢物的反应是否是该基因组的特异性反应;
(1I)、新建new-rec.txt文件,将特异性反应保存到new-rec.txt文件中,遍历new-rec.txt文件中的每一个反应,查看粗模型中是否存在该反应,不存在则添加。
2.如权利要求1所述的基因组代谢网络模型自动化修正方法,其特征是,所述步骤(1H)具体包括以下步骤:
(1H1)、通过网络爬虫技术,提交并分析步骤(1E)的页面page,提取KO号在网页中对应的所有坐标;
(1H2)、定位到KO号所在的方形框后选取框内的像素点,读取其颜色的RGB值;
(1H3)如果值为0或者255,则没有颜色标记,判断不是物种的特异性反应;如果值在0~255之间,则有颜色标记,判断是物种的特异性反应。
3.如权利要求1所述的基因组代谢网络模型自动化修正方法,其特征是,步骤(2)具体包括以下步骤:
(2A)、通过网络爬虫技术,以代谢物名称在KEGG、MetaCyc,MetRxn三个网站中查找各个反应的方向,提取并保存各个反应在3个网站中的方向信息;
(2B)、如果反应应在MetaCyc和MetRxn两个网站中均为不可逆,判断为不可逆反应,否则判断为可逆反应。
4.如权利要求1所述的基因组代谢网络模型自动化修正方法,其特征是,步骤(3)的实现方法为:计算各个蛋白区间网站在该物种对应类群数据集上的权重,之后对各个网站蛋白区间返回的结果采用加权计算,确定最佳反应区间。
5.如权利要求4所述的基因组代谢网络模型自动化修正方法,其特征是,步骤(3)具体包括以下步骤:
(3A)、根据每条反应获取对应的KO号,在KASS注释结果中查找其对应的genbank编号gb;在该物种蛋白序列库中找到对应的蛋白序列;
(3B)、将蛋白序列提交到对应网站的表单中,获取返回的定位信息;
(3C)、新建该物种对应类群数据集,并在新数据集上计算各个网站的权重;
(3D)、加权计算各个反应的发生区间,确定最佳区间并将其填入反应式中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510131784.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:个人信息保护方法及保护装置
- 下一篇:一种分裂指叉指换能器性能的计算方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





