[发明专利]一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法有效
申请号: | 201310720089.4 | 申请日: | 2013-12-23 |
公开(公告)号: | CN103714265A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 张贵军;陈先跑;周晓根;秦传庆;张贝金;明洁;刘玉栋 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法,包括以下步骤:首先针对蛋白质高维构象空间搜索空间复杂难题,在Rosetta力场模型下,根据蛋白质数据库构建片段库,利用蒙特卡洛统计方法,判断片段替换的有效性;在差分进化群体算法框架下,片段组装使得搜索空间的复杂度降低,同时,利用蒙特卡洛统计方法剔除错误的片段组装,通过进化算法的多样性,逐步减小构象搜索空间以提高搜索效率;同时,利用粗粒度的模型,忽略侧链,有效减小了搜索的代价。本发明有效得到局最优稳定构想、预测效率较高、收敛正确性较好。 | ||
搜索关键词: | 一种 基于 蒙特卡洛 局部 抖动 片段 组装 蛋白质 三维 结构 预测 方法 | ||
【主权项】:
1.一种基于蒙特卡洛局部抖动和片段组装的蛋白质三维结构预测方法,其特征在于:包括以下步骤:1)选取力场模型采用Rosetta力场模型能量函数的表示形式如下:Eprotein=Winter repEinter rep+Winter atrEinter atr+WsolvationEsolvation+Wbb/sc hbEbb/sc hb+Wbb/bb hbEbb/bb hb+Wsc/sc hbEsc/sc hb+WpairEpair+WdunbrackEdunbrack+WramaErama+WreferenceEreference式中,Eprotein表示蛋白质的总能量,Einter rep表示范德华排斥力作用,Winter rep为Einter rep在整体的权重,Einter atr表示范德华吸引力作用,Winter atr为Einter atr在整体的权重,Esolvation为Lazarids和Karplus描述的隐含的溶解作用,Wsolvation为Esolvation在整体的权重,Ebb/sc hb、Ebb/bb hb、Esc/sc hb为依赖方向的氢键能量,Wbb/sc hb、Wbb/bb hb、Wsc/sc hb分别为其能量在整体的权重,Epair为残基对静电作用,Wpair为Epair在整体的权重,Edunbrack为氨基酸基于旋转异构体库的内部的能量,Wdunbrack为Edunbrack在整体的权重,Erama为参考特定位置的Ramachandrin骨链扭力,Wrama为Erama在整体的权重,Ereference为未折叠态的蛋白质的参考能量,Wreference为Ereference在整体的权重,Rosetta的能量函数就是将所有的能量项通过各自的权重线性相加;2)设置权重比,采用Rosetta的score3权重比,采用一种粗粒度的能量函数;3)片段库的构建,通过一条蛋白质序列,从已知的知识库,实验测得的蛋白质数据库获取各个片段的信息,采用n个氨基酸的片段,n为大于2的整数,即将已有的一系列数据库中的蛋白质,分解成n个氨基酸的片段,通过判断各个原子之间的距离,分析四个原子构成的平面的二面角,以及均方根偏差等来分析各个片段的相似性,将每个位置相似性最大的m个片段信息记录下来,m为大于1的整数,在使用过程中,通过索引使用此片段库;4)初始化,设置群体规模popSize,进化代数G,变异因子F为0.5,随机产生popSize个蛋白质结构作为初始种群,每个个体表示为:Xi(i=1,2,…,popSize),其中i为个体在种群中的序列,在进化过程中,种群规模保持不变;5)对每一个目标个体Xi(i=1,2,…,popSize)作如下处理:5.1)任意选三个个体{Xr1,Xr2,Xr3|r1,r2,r3∈{1,2,…,popSize},r1≠r2≠r3≠i};5.2)对选择出的种群的三个个体{Xr1,Xr2,Xr3}执行变异操作Vi=Xr1+F*(Xr2-Xr3),生成变异个体Vi;5.3)设置蒙特卡洛方法的循环次数ncycle=50;5.4)将变异个体Vi作为蒙特卡洛方法的初始构象,并且计算能量Evi;5.5)在变异个体Vi上分别随机选择三个不同的片段,分别从片段库中随机挑选相似的片段进行替换,即三种二面角的替换,交叉,生成测试个体
5.6)计算测试个体的能量
变异个体Vi与测试个体
的能量差
如果ΔU>0,则接受这个构象,将测试个体
作为变异个体Vi,i=i+1;如果i<ncycle,转至步骤5.4)5.7)j=j+1;如果j<popSize,转至步骤5.1)6)对目标个体Xi和测试个体
逐个更新操作:6.1)计算目标个体Xi的能量和测试个体
的能量和均方根偏差,如果目标个体
的能量和均方根偏差比测试个体
的大,则将目标个体Xi和测试个体
进行替换,更新目标个体;6.2)n=n+1;如果n<popSize,转至6.1)7)k=k+1;如果k<G,转至5)8)k=G时的目标个体为结构接近实验测得的蛋白质结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310720089.4/,转载请声明来源钻瓜专利网。
- 上一篇:银杏酚C17:1在肝癌治疗中的用途
- 下一篇:一种双向旋转风扇的蜗壳结构
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用