[发明专利]一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法有效
申请号: | 201610845314.0 | 申请日: | 2016-09-23 |
公开(公告)号: | CN106503484B | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 张贵军;周晓根;郝小虎;王柳静;俞旭锋;徐东伟;李章维 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G06N3/12 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法,首先,计算当前种群中各构象个体到新构象的距离,并根据距离进行升序排列;然后,选取新构象个体的部分邻近构象个体抽象凸下界估计支撑面,以获取新构象个体的能量下界估计值;其次,计算所有新构象个体的能量下界估计值与实际能量值之间的平均估计误差,并根据平均估计误差的变化将整个算法分为多个优化阶段;最后,根据上一次迭代中的平均估计误差判断当前迭代所处的阶段,并对各阶段设计不同的策略生成新构象个体。本发明提出一种预测精度高、计算代价低的基于群体抽象凸估计的多阶段差分进化蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 抽象 估计 阶段 进化 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于抽象凸估计的多阶段差分进化蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:1)选取蛋白质力场模型,即能量函数E(X);2)给定输入序列信息;3)初始化:种群规模NP,交叉概率CR,阶段控制参数μ,支撑面斜率控制因子M;根据输入序列产生初始构象种群![]()
其中,N表示维数,
表示第i个构象Ci的第N维坐标,并初始化迭代次数G=0;4)随机生成正整数rand1,rand2,rand3均∈{1,2,3,......NP},且rand1≠rand2≠rand3;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1,randrange2,randrange3,randrange4均∈{1,2,…,L},randrange1≠randrange2,randrange3≠randrange4,L为序列长度;令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;5)如果G=0,对于当前种群中的每个构象个体Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目标构象个体,执行如下操作生成测试构象个体Ctrial:5.1)用Crand2上位置a到位置b的片段的氨基酸k所对应的二面角替换Crand1的相同位置所对应的二面角;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角替换Crand1上相同位置所对应的二面角,然后将所得Crand1进行片段组装得到变异构象个体Cmutant;5.2)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L),若rand4≤CR,则利用目标构象Ctarget中的rand5片段替换变异构象Cmutant中的rand5片段,从而生成测试构象Ctrial;若rand4>CR,则Ctrial直接等于变异构象Cmutant;6)如果G>0,则执行如下阶段性操作:6.1)计算第G‑1次迭代中生成的每个测试构象个体的能量下界估计值:6.1.1)计算当前种群中每个构象个体到测试构象个体之间的距离
其中
表示第i个构象Ci的第j维坐标,
表示测试构象Ctrial的第j维坐标,di表示第i个构象Ci到测试构象的距离;6.1.2)根据距离对所有构象进行升序排列,选取前两个构象个体并记为
并计算其下界估计支撑面:
其中,
为所选构象
的能量函数值,
为所选构象个体
的第j维坐标,
为辅助变量,M为支撑面斜率控制因子;6.1.3)计算测试构象Ctrial的能量下界估计值![]()
其中max表示求最大值,min表示求最小值,
为测试构象向量
的第j维元素,![]()
为下界估计支撑面lt的第j维元素;6.2)计算所有测试构象的平均估计误差
其中
表示第i个测试构象的能量下界估计值,
表示第i个测试构象的实际能量函数值,如果G=0,则最大平均估计误差为UEmax;6.3)对平均估计误差UE进行归一化处理,UE的归一化值为
其中UEmin=0为最小平均估计误差;6.4)根据归一化平均估计误差值判断算法所处的阶段,并采样不同的策略生成变异构象Cmutant:6.4.1)如果
则用Crand1上位置a到位置b的片段的氨基酸k所对应的二面角替换Ctarget的相同位置所对应的二面角;再使用Crand2上位置c到位置d的片段的氨基酸所对应的二面角替换Ctarget上相同位置所对应的二面角,然后将所得Ctarget进行片段组装得到变异构象Cmutant,其中μ为阶段控制参数;6.4.2)如果
则根据如下操作生成变异构象Cmutant:a)根据能量函数值对当前种群中的构象个体进行降序排列,选取前NP/5个构象
并计算所选构象的质心构象Ccentroid=(xcentroid,1,xcentroid,2,…,xcentroid,N),其中,构象Ccentroid的第j维元素![]()
![]()
表示第m个选取构象
的第N维坐标,
为构象
的实际能量函数值;b)从当前种群中随机选取两个不同的构象Crand1和Crand2,其中rand1,rand2均∈[1,NP],rand1≠rand2,提取构象Crand1位置a到位置b的片段的氨基酸所对应的二面角替换质心构象Ccentroid的相同位置所对应的二面角,同时使用Crand2上位置c到位置d的片段的氨基酸所对应的二面角替换质心构象Ccentroid相同位置所对应的二面角,然后将所得Ccentroid进行片段组装得到变异构象个体Cmutant;6.4.3)如果
找出当前种群中能量最低的构象Cbest,用Cbest上位置a到位置b的片段的氨基酸k所对应的二面角替换Ctarget的相同位置所对应的二面角;再使用Crand1上位置c到位置d的片段的氨基酸p所对应的二面角替换Ctarget上相同位置所对应的二面角,然后将所得Ctarget进行片段组装得到变异构象个体Cmutant;6.4.4)根据步骤5.2)生成测试构象个体Ctrial;7)分别计算目标构象和测试构象的能量函数值f(Ctarget)和f(Ctrial),如果f(Ctrial)<f(Ctarget),则测试构象个体替换目标构象个体;8)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤4)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610845314.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种新型移动终端找寻系统
- 下一篇:一种通话方法及移动终端