[发明专利]一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法有效

专利信息
申请号: 201310720089.4 申请日: 2013-12-23
公开(公告)号: CN103714265A 公开(公告)日: 2014-04-09
发明(设计)人: 张贵军;陈先跑;周晓根;秦传庆;张贝金;明洁;刘玉栋 申请(专利权)人: 浙江工业大学
主分类号: G06F19/16 分类号: G06F19/16
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法,包括以下步骤:首先针对蛋白质高维构象空间搜索空间复杂难题,在Rosetta力场模型下,根据蛋白质数据库构建片段库,利用蒙特卡洛统计方法,判断片段替换的有效性;在差分进化群体算法框架下,片段组装使得搜索空间的复杂度降低,同时,利用蒙特卡洛统计方法剔除错误的片段组装,通过进化算法的多样性,逐步减小构象搜索空间以提高搜索效率;同时,利用粗粒度的模型,忽略侧链,有效减小了搜索的代价。本发明有效得到局最优稳定构想、预测效率较高、收敛正确性较好。
搜索关键词: 一种 基于 蒙特卡洛 局部 抖动 片段 组装 蛋白质 三维 结构 预测 方法
【主权项】:
1.一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法,其特征在于:包括以下步骤:1)选取力场模型采用Rosetta力场模型能量函数的表示形式如下:Eprotein=Winter repEinter rep+Winter atrEinter atr+WsolvationEsolvation+Wbb/sc hbEbb/sc hb+Wbb/bb hbEbb/bb hb+Wsc/sc hbEsc/sc hb+WpairEpair+WdunbrackEdunbrack+WramaErama+WreferenceEreference式中,Eprotein表示蛋白质的总能量,Einter rep表示范德华排斥力作用,Winter rep为Einter rep在整体的权重,Einter atr表示范德华吸引力作用,Winter atr为Einter atr在整体的权重,Esolvation为Lazarids和Karplus描述的隐含的溶解作用,Wsolvation为Esolvation在整体的权重,Ebb/sc hb、Ebb/bb hb、Esc/sc hb为依赖方向的氢键能量,Wbb/sc hb、Wbb/bb hb、Wsc/sc hb分别为其能量在整体的权重,Epair为残基对静电作用,Wpair为Epair在整体的权重,Edunbrack为氨基酸基于旋转异构体库的内部的能量,Wdunbrack为Edunbrack在整体的权重,Erama为参考特定位置的Ramachandrin骨链扭力,Wrama为Erama在整体的权重,Ereference为未折叠态的蛋白质的参考能量,Wreference为Ereference在整体的权重,Rosetta的能量函数就是将所有的能量项通过各自的权重线性相加;2)设置权重比,采用Rosetta的score3权重比,采用一种粗粒度的能量函数;3)片段库的构建,通过一条蛋白质序列,从已知的知识库,实验测得的蛋白质数据库获取各个片段的信息,采用n个氨基酸的片段,n为大于2的整数,即将已有的一系列数据库中的蛋白质,分解成n个氨基酸的片段,通过判断各个原子之间的距离,分析四个原子构成的平面的二面角,以及均方根偏差等来分析各个片段的相似性,将每个位置相似性最大的m个片段信息记录下来,m为大于1的整数,在使用过程中,通过索引使用此片段库;4)初始化,设置群体规模popSize,进化代数G,变异因子F为0.5,随机产生popSize个蛋白质结构作为初始种群,每个个体表示为:Xi(i=1,2,…,popSize),其中i为个体在种群中的序列,在进化过程中,种群规模保持不变;5)对每一个目标个体Xi(i=1,2,…,popSize)作如下处理:5.1)任意选三个个体{Xr1,Xr2,Xr3|r1,r2,r3∈{1,2,…,popSize},r1≠r2≠r3≠i};5.2)对选择出的种群的三个个体{Xr1,Xr2,Xr3}执行变异操作Vi=Xr1+F*(Xr2-Xr3),生成变异个体Vi;5.3)设置蒙特卡洛方法的循环次数ncycle=50;5.4)将变异个体Vi作为蒙特卡洛方法的初始构象,并且计算能量Evi;5.5)在变异个体Vi上分别随机选择三个不同的片段,分别从片段库中随机挑选相似的片段进行替换,即三种二面角的替换,交叉,生成测试个体5.6)计算测试个体的能量变异个体Vi与测试个体的能量差如果ΔU>0,则接受这个构象,将测试个体作为变异个体Vi,i=i+1;如果i<ncycle,转至步骤5.4)5.7)j=j+1;如果j<popSize,转至步骤5.1)6)对目标个体Xi和测试个体逐个更新操作:6.1)计算目标个体Xi的能量和测试个体的能量和均方根偏差,如果目标个体的能量和均方根偏差比测试个体的大,则将目标个体Xi和测试个体进行替换,更新目标个体;6.2)n=n+1;如果n<popSize,转至6.1)7)k=k+1;如果k<G,转至5)8)k=G时的目标个体为结构接近实验测得的蛋白质结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310720089.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top