[发明专利]一种基因组代谢网络模型自动化修正方法有效
| 申请号: | 201510131784.6 | 申请日: | 2015-03-24 |
| 公开(公告)号: | CN104699997B | 公开(公告)日: | 2017-05-10 |
| 发明(设计)人: | 张梁;吴晓红;薛卫;李由然;李赢;丁重阳;石贵阳 | 申请(专利权)人: | 江南大学 |
| 主分类号: | G06F19/12 | 分类号: | G06F19/12 |
| 代理公司: | 无锡华源专利商标事务所(普通合伙)32228 | 代理人: | 林弘毅,聂汉钦 |
| 地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基因组代谢网络模型自动化修正方法,利用了超文本传送协议和Java控件HttpClient相结合、并利用图像处理算法,实现自动提交并分析网站脚本语义,基于KEGG、MetaCyc、MetRxn在线数据库以及多个蛋白区间定位预测网站对基因组规模代谢网络模型进行了自动化断点补齐,同时通过蛋白区间预测结果和权重打分机制确定可信度高的特异性反应,完成代谢网络粗模型的自动化修正过程。利用本发明所述的方法进行基因组代谢网络模型修正的优点是更加省时、方便,且所得修正模型更为全面、准确。 | ||
| 搜索关键词: | 一种 基因组 代谢 网络 模型 自动化 修正 方法 | ||
【主权项】:
一种基因组代谢网络模型自动化修正方法,其特征是,包括以下步骤:(1)、根据基因组代谢网络模型中的漏洞代谢物列表,填补物种的特异性反应;(2)、根据物种的特异性反应中代谢物名称,确定模型中反应的方向;(3)、确定模型中最佳反应区间;步骤(1)包括:(1A)、使用matlab软件,将基因组代谢网络粗模型转化为计算机可读格式,并进行代谢物漏洞查找;(1B)、向KEGG网站的自动注释服务器KASS提交物种的基因组蛋白序列,KASS自动注释返回该蛋白序列发生的Pathway list;(1C)、在粗模型中确定漏洞代谢物的反应途径,并在步骤(1B)中得到的Pathway list中找到该反应途径;(1D)、根据步骤(1C)中找到的漏洞代谢物的反应途径得到基因代谢网络的图谱的URL地址,向URL地址发送http请求,得到服务器端响应的网页图片记为图谱T,图谱T中包括代谢途径方框;(1E)、点击步骤(1D)中图谱T的代谢途径方框,进入包含所有反应的页面page,页面page中包括蛋白序列的EC号,每一个EC号对应图谱T中的一个具体反应,EC号的URL地址指向具体的反应方程式;(1F)、获取EC号在页面page中所对应的KO号和具体的反应方程Reaction,新建文件KO‑EC‑Reaction.txt,将EC号和与之对应的KO号、反应方程Reaction写入文件KO‑EC‑Reaction.txt;(1G)、按行读取步骤(1F)中文件KO‑EC‑Reaction.txt的内容,循环遍历,提取KO‑EC‑Reaction文件中包含漏洞代谢物的反应,新建文件EC‑KO‑Break.txt,将包含漏洞代谢物的EC号,KO号,反应方程Reaction的信息保存在文件EC‑KO‑Break.txt中;(1H)、确定步骤(1G)提取的包含漏洞代谢物的反应是否是该基因组的特异性反应;(1I)、新建new‑rec.txt文件,将特异性反应保存到new‑rec.txt文件中,遍历new‑rec.txt文件中的每一个反应,查看粗模型中是否存在该反应,不存在则添加。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510131784.6/,转载请声明来源钻瓜专利网。
- 上一篇:个人信息保护方法及保护装置
- 下一篇:一种分裂指叉指换能器性能的计算方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





