[发明专利]一种基于复合结构特征的多模态蛋白质构象空间优化方法有效

专利信息
申请号: 201710756612.7 申请日: 2017-08-29
公开(公告)号: CN107506613B 公开(公告)日: 2020-08-18
发明(设计)人: 张贵军;郝小虎;谢腾宇;周晓根 申请(专利权)人: 浙江工业大学
主分类号: G16B30/10 分类号: G16B30/10;G16B20/20
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于复合结构特征的多模态蛋白质构象空间优化方法,包括以下步骤:基于进化算法框架,以RosettaScore3为优化目标函数,统计得到种群个体的个体距离谱,个体二级结构谱,个体二面角谱三种结构特征,通过多模态策略提高算法采样的多样性,根据结构特征选择子代个体,可以有效的弥补能量模型不精确的缺陷,通过进化迭代,可以得到精度较高的预测结构。本发明采样效率较高、复杂度较低、预测精度较高。
搜索关键词: 一种 基于 复合 结构 特征 多模态 蛋白质 构象 空间 优化 方法
【主权项】:
一种基于复合结构特征的多模态蛋白质构象空间优化方法,其特征在于,包括以下步骤:1)给定待预测蛋白质的氨基酸序列信息,根据给定氨基酸序列信息,利用QUARK服务器获取基于统计的二级结构谱PSS,二面角谱PDA,距离谱PD;2)参数初始化:种群规模PN,模态数目NM,最大迭代次数Gmax,序列长度SL,交叉长度Nmu;3)种群初始化:根据给定输入氨基酸序列,对PN个个体依次进行SL次片段组装,根据每个个体的三维结构信息统计得到对应的的个体二级结构谱PrSS,个体二面角谱PrDA,个体距离谱PrD,设置每个个体为一个初始模态,并且该个体为该模态的态心;4)开始迭代,当前迭代次数i=1,过程如下:4.1)如果前模态数目>NM,则执行模态形成过程,否则转到步骤4.2),过程如下:4.1.1)随机选择种群中的一个个体作为目标个体Pt;4.1.2)对Pt做NF次片段组装,得到变异个体Pm;4.1.3)生成一个随机数R1,R1∈[1,SL‑Nmu],其中Nmu是交叉长度;4.1.4)对Pm和Pt做交叉操作:交换Pm和Pt的第R1到R1+Nmu个残基二面角,生成交叉个体Pc1和Pc2;4.1.5)采用RosettaScore3能量函数对Pt、Pm、Pc1、Pc2进行能量评价,得到其对应的能量分值Et,Em,Ec1,Ec2;4.1.6)如果Em,Ec1,Ec2全部大于Et,则采用能量概率模型选择接收其中一个个体,过程如下:4.1.6.1)分别计算Pm、Pc1、Pc2的能量接收概率:4.1.6.2)生成一个随机数R2,分别计算pm,pc1,pc2与R2的差值,选择差值最小的对应的个体作为子代个体Pc,并取代目标个体Pt;4.1.7)否则,选择Em,Ec1,Ec2中最小的值对应的个体作为子代个体Pc,并取代目标个体Pt;4.1.8)根据每个个体的三维结构信息统计得到Pc的PrSS,PrDA,PrD;4.1.9)通过计算Pc与各个模态态心个体距离谱之间的汉明距离HD,确定Pc应该归属于某一个模态:取HD值最小对应的模态为Pc所归属的模态,如果有2个以上模态HD值同时取得最小值,则计算Pc与这些模态态心个体二面角谱之间的汉明距离HDA,取HDA值最小对应的模态为Pc所归属的模态,如果有2个以上模态HDA值同时确定最小值,则计算Pc与这些模态态心个体二级结构谱之间的汉明距离HSS,取HSS值最小对应的模态为Pc所归属的模态,取当前模态内所有个体的质心作为当前模态的态心;4.1.10)当前迭代次数i=i+1;4.1.11)返回步骤4.1);4.2)如果当前迭代次数i<Gmax,则执行模态搜索过程,否则转到步骤5),过程如下:4.2.1)随机选择NM个模态中的一个模态;4.2.2)从选中的模态中随机选择一个个体作为目标个体Pt;4.2.3)对Pt做NF次片段组装,得到变异个体Pm;4.2.4)生成一个随机数R1',R1'∈[1,SL‑Nmu],其中Nmu是交叉长度;4.2.5)对Pm和Pt做交叉操作:交换Pm和Pt的第R1'到R1'+Nmu个残基二面角,生成交叉个体Pc1和Pc2;4.2.6)采用RosettaScore3能量函数对个体Pt、Pm、Pc1、Pc2进行能量评价,得到其对应的能量分值Et,Em,Ec1,Ec2;4.2.7)选择Em,Ec1,Ec2中的最小值Emin对应的个体作为候选子代个体Pch;4.2.8)如果Emin>Et,则按照特征概率模型选择子代个体,过程如下:4.2.8.1)分别计算个体Pm、Pc1、Pc2对应的特征接收概率其中ΔHDAm,ΔHSSm,ΔHDm分别表示个体Pm的PrD与PD之间的汉明距离,ΔHDAc1,ΔHSSc1,ΔHDc1分别表示个体Pc1的PrDA与PDA之间的汉明距离,ΔHDAc2,ΔHSSc2,ΔHDc2、Pc2分别表示个体Pc2的PrSS与PSS之间的汉明距离,ΔHDAc1,ΔHSSc1,ΔHDc1和ΔHDAc2,ΔHSSc2,ΔHDc2中上角标c1,c2为个体Pc1、Pc2的标记;4.2.8.2)选择Pm、Pc1、Pc2中最大值所对应的个体作为子代个体Pc,并取代目标个体Pt;4.2.9)如果Em,Ec1,Ec2中的最小值Emin<Et,则选择Pch为子代个体Pc,并取代目标个体Pt;4.2.10)根据每个个体的三维结构信息统计得到Pc的PrSS,PrDA,PrD;4.2.11)通过计算Pc与各个模态态心个体距离谱之间的汉明距离HD,确定Pc应该归属于某一个模态:取HD值最小对应的模态为Pc所归属的模态,如果有2个以上模态HD值同时最小,则计算Pc与这些模态态心个体二面角谱之间的汉明距离HDA,取HDA值最小对应的模态为Pc所归属的模态,如果有2个以上模态HDA值同时最小,则计算Pc与这些模态态心个体二级结构谱之间的汉明距离HSS,取HSS值最小对应的模态为Pc所归属的模态,取当前模态内所有个体的质心作为当前模态的态心;4.2.12)当前迭代次数i=i+1;4.2.13)返回步骤4.2);5)迭代结束,输出预测结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710756612.7/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top