[发明专利]一种基于复合结构特征的多模态蛋白质构象空间优化方法有效
申请号: | 201710756612.7 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107506613B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 张贵军;郝小虎;谢腾宇;周晓根 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于复合结构特征的多模态蛋白质构象空间优化方法,包括以下步骤:基于进化算法框架,以RosettaScore3为优化目标函数,统计得到种群个体的个体距离谱,个体二级结构谱,个体二面角谱三种结构特征,通过多模态策略提高算法采样的多样性,根据结构特征选择子代个体,可以有效的弥补能量模型不精确的缺陷,通过进化迭代,可以得到精度较高的预测结构。本发明采样效率较高、复杂度较低、预测精度较高。 | ||
搜索关键词: | 一种 基于 复合 结构 特征 多模态 蛋白质 构象 空间 优化 方法 | ||
【主权项】:
一种基于复合结构特征的多模态蛋白质构象空间优化方法,其特征在于,包括以下步骤:1)给定待预测蛋白质的氨基酸序列信息,根据给定氨基酸序列信息,利用QUARK服务器获取基于统计的二级结构谱PSS,二面角谱PDA,距离谱PD;2)参数初始化:种群规模PN,模态数目NM,最大迭代次数Gmax,序列长度SL,交叉长度Nmu;3)种群初始化:根据给定输入氨基酸序列,对PN个个体依次进行SL次片段组装,根据每个个体的三维结构信息统计得到对应的的个体二级结构谱PrSS,个体二面角谱PrDA,个体距离谱PrD,设置每个个体为一个初始模态,并且该个体为该模态的态心;4)开始迭代,当前迭代次数i=1,过程如下:4.1)如果前模态数目>NM,则执行模态形成过程,否则转到步骤4.2),过程如下:4.1.1)随机选择种群中的一个个体作为目标个体Pt;4.1.2)对Pt做NF次片段组装,得到变异个体Pm;4.1.3)生成一个随机数R1,R1∈[1,SL‑Nmu],其中Nmu是交叉长度;4.1.4)对Pm和Pt做交叉操作:交换Pm和Pt的第R1到R1+Nmu个残基二面角,生成交叉个体Pc1和Pc2;4.1.5)采用RosettaScore3能量函数对Pt、Pm、Pc1、Pc2进行能量评价,得到其对应的能量分值Et,Em,Ec1,Ec2;4.1.6)如果Em,Ec1,Ec2全部大于Et,则采用能量概率模型选择接收其中一个个体,过程如下:4.1.6.1)分别计算Pm、Pc1、Pc2的能量接收概率:4.1.6.2)生成一个随机数R2,分别计算pm,pc1,pc2与R2的差值,选择差值最小的对应的个体作为子代个体Pc,并取代目标个体Pt;4.1.7)否则,选择Em,Ec1,Ec2中最小的值对应的个体作为子代个体Pc,并取代目标个体Pt;4.1.8)根据每个个体的三维结构信息统计得到Pc的PrSS,PrDA,PrD;4.1.9)通过计算Pc与各个模态态心个体距离谱之间的汉明距离HD,确定Pc应该归属于某一个模态:取HD值最小对应的模态为Pc所归属的模态,如果有2个以上模态HD值同时取得最小值,则计算Pc与这些模态态心个体二面角谱之间的汉明距离HDA,取HDA值最小对应的模态为Pc所归属的模态,如果有2个以上模态HDA值同时确定最小值,则计算Pc与这些模态态心个体二级结构谱之间的汉明距离HSS,取HSS值最小对应的模态为Pc所归属的模态,取当前模态内所有个体的质心作为当前模态的态心;4.1.10)当前迭代次数i=i+1;4.1.11)返回步骤4.1);4.2)如果当前迭代次数i<Gmax,则执行模态搜索过程,否则转到步骤5),过程如下:4.2.1)随机选择NM个模态中的一个模态;4.2.2)从选中的模态中随机选择一个个体作为目标个体Pt;4.2.3)对Pt做NF次片段组装,得到变异个体Pm;4.2.4)生成一个随机数R1',R1'∈[1,SL‑Nmu],其中Nmu是交叉长度;4.2.5)对Pm和Pt做交叉操作:交换Pm和Pt的第R1'到R1'+Nmu个残基二面角,生成交叉个体Pc1和Pc2;4.2.6)采用RosettaScore3能量函数对个体Pt、Pm、Pc1、Pc2进行能量评价,得到其对应的能量分值Et,Em,Ec1,Ec2;4.2.7)选择Em,Ec1,Ec2中的最小值Emin对应的个体作为候选子代个体Pch;4.2.8)如果Emin>Et,则按照特征概率模型选择子代个体,过程如下:4.2.8.1)分别计算个体Pm、Pc1、Pc2对应的特征接收概率其中ΔHDAm,ΔHSSm,ΔHDm分别表示个体Pm的PrD与PD之间的汉明距离,ΔHDAc1,ΔHSSc1,ΔHDc1分别表示个体Pc1的PrDA与PDA之间的汉明距离,ΔHDAc2,ΔHSSc2,ΔHDc2、Pc2分别表示个体Pc2的PrSS与PSS之间的汉明距离,ΔHDAc1,ΔHSSc1,ΔHDc1和ΔHDAc2,ΔHSSc2,ΔHDc2中上角标c1,c2为个体Pc1、Pc2的标记;4.2.8.2)选择Pm、Pc1、Pc2中最大值所对应的个体作为子代个体Pc,并取代目标个体Pt;4.2.9)如果Em,Ec1,Ec2中的最小值Emin<Et,则选择Pch为子代个体Pc,并取代目标个体Pt;4.2.10)根据每个个体的三维结构信息统计得到Pc的PrSS,PrDA,PrD;4.2.11)通过计算Pc与各个模态态心个体距离谱之间的汉明距离HD,确定Pc应该归属于某一个模态:取HD值最小对应的模态为Pc所归属的模态,如果有2个以上模态HD值同时最小,则计算Pc与这些模态态心个体二面角谱之间的汉明距离HDA,取HDA值最小对应的模态为Pc所归属的模态,如果有2个以上模态HDA值同时最小,则计算Pc与这些模态态心个体二级结构谱之间的汉明距离HSS,取HSS值最小对应的模态为Pc所归属的模态,取当前模态内所有个体的质心作为当前模态的态心;4.2.12)当前迭代次数i=i+1;4.2.13)返回步骤4.2);5)迭代结束,输出预测结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710756612.7/,转载请声明来源钻瓜专利网。