[发明专利]一种基于多种群系综变异策略的蛋白质结构预测方法有效

专利信息
申请号: 201810762915.4 申请日: 2018-07-12
公开(公告)号: CN109509510B 公开(公告)日: 2021-06-18
发明(设计)人: 张贵军;彭春祥;周晓根;刘俊;王柳静;胡俊 申请(专利权)人: 浙江工业大学
主分类号: G16B30/10 分类号: G16B30/10
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于多种群系综变异策略的蛋白质结构预测方法,在进化算法框架下,首先,把种群平均分为四个子种群,并且通过各子种群中的构象协同合作,对每一个子种群分别设计不同的变异策略;其次根据Rosetta能量函数score3、距离误差系数以及蒙特卡洛概率接收准则对构象进行选择,来指导构象的更新过程,不仅能够缓解能量函数不精确的问题,而且可以引导算法采样得到能量更低且结构更合理的构象,同时提高采样效率。本发明提供一种采样效率和预测精度都较高的基于多种群系综变异策略的蛋白质结构预测方法。
搜索关键词: 一种 基于 多种 群系 变异 策略 蛋白质 结构 预测 方法
【主权项】:
1.一种基于多种群系综变异策略的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;3)根据序列信息从QUARK服务器上得到距离谱文件;4)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,置迭代代数g=0;5)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP},把NP个个体平均分成四个子种群,即其中,j={1,2,…,NP/4},k={NP/4+1,…,NP/2},m={NP/2+1,…,NP3/4},n={3NP/4+1,…,NP};6)对第一个子种群中的个体进行如下操作:6.1)将设为目标个体在第一个子种群中随机选出一个构象个体从剩下的三个子种群中随机选择两个子种群,再分别从这两个子种群中随机取出两个个体Ca,Cb,分别从Ca、Cb中随机选择一个位置不同的9片段,分别替换到对应的位置的片段生成变异构象进行一次片段组装生成构象6.2)随机生成一个0和1之间的均匀分布小数R,若R>CR,则从上随机选择一个9片段替换到对应位置;否则保持不变,把这一操作的到的构象记为测试构象6.3)用Rosetta score3能量函数分别计算的能量:6.4)若则构象替换接收次数count1加1,并转到步骤6.8),否则,继续执行步骤6.5);6.5)根据距离谱中的残基对分别计算的残基间距离然后分别根据公式(1)、(2)计算的距离误差系数Dtrial和Dtarget,其中,T表示距离谱中残基对的数量,分别表示构象中第t对残基对应Cα原子之间的距离,dN表示距离谱第N个距离区间中距离谱的平均值,PDN表示距离谱长度在区间N内的数量,距离谱中距离范围为(0,9),距离间隔为0.5,即距离区间为(0,0.5],(0.5,1],…,(8.5,9);6.6)若Dtrial<Dtarget,则构象替换构象接收次数count1加1,否则进行步骤6.7);6.7)计算目标构象和测试构象的距离误差系数差▽D=Dtarget‑Dtrial,按照概率以蒙特卡洛准则接受构象其中β为温度因子;6.8)j=j+1,迭代运行步骤6.1)~6.8),至j=NP/4为止;7)对第二个子种群中每一个构象进行操作,操作如下:7.1)将构象记作目标个体从第二个子种群中选择一个能量最低的构象从其它三个子群中随机选择其中两个种群,并从它们中的分别随机选择两个构象Cc、Cd,分别对Cc、Cd不同位置随机选择一个9片段,替换给对应的位置,生成进行一次片段组装生成构象7.2)根据6.2)~6.7)对应的步骤对进行操作,其中,测试构象被接收的次数记为count2;7.3)k=k+1,迭代运行步骤7.1)~7.2),至k=NP/2为止;8)对第三组子种群中每个构象进行操作,操作如下:8.1)将构象记为目标个体对第三组子种群按能量从小到大进行排序,在前一半的构象中随机选择一个个体然后从其它三个子种群中随机选择两个子种群,再从这两个子种群中分别随机选择构象Ce和Cf,分别对Ce、Cf不同位置随机选择一个9片段,替换给Cpbest对应的位置,生成进行一次片段组装生成构象8.2)根据6.2)~6.7)对应的步骤对构象进行操作,其中,测试构象被接收的次数记为count3;8.3)m=m+1,迭代运行步骤8.1)~8.2),至k=NP3/4为止;9)对第四组子种群中的所有构象进行Rosetta片段组装操作;10)迭代运行步骤6)~9),每隔20代统计count1、count2、count3的大小,选择count1、count2、count3中的最大值所对应的种群变异策略的方式对第四个子种群进行变异,根据步骤6.2)~6.8)进行操作,并把count1、count2、count3置零;11)g=g+1,迭代运行步骤6)~10),至g>G为止;12)输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810762915.4/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top