[发明专利]基于多目标粒子群优化的蛋白质结构预测方法在审
申请号: | 201710244181.6 | 申请日: | 2017-04-14 |
公开(公告)号: | CN107025383A | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 沈红斌;耿玲 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18;G06F19/16 |
代理公司: | 上海伯瑞杰知识产权代理有限公司31227 | 代理人: | 李庆 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多目标 粒子 优化 蛋白质 结构 预测 方法 | ||
1.一种基于多目标粒子群优化的蛋白质结构预测方法,包括步骤:
S1:在一待预测的蛋白质序列中选择需要优化的n个不同初始结构作为n个目标粒子,并将每一所述目标粒子的位置坐标以构象表示的形式表示,n为大于零的自然数;
S2:对一更新公式进行参数设置;
S3:根据所述更新公式对三目标能量公式进行迭代,并获得一更优解集;
S4:处理所述最优解集获得一最优解,并将所述最优解作为所述目标粒子的预测位置。
2.根据权利要1所述的基于多目标粒子群优化的蛋白质结构预测方法,其特征在于,所述更新公式包括公式(1)和公式(2):
其中,w为惯性系数,k为迭代次数,c1为认知系数,c2为社会系数;为更新速度,所述更新速度表示第i粒子在第k次迭代过程中相比上一次迭代过程中改变结构的速度;rand为0~1之间的随机数;为历史最优结构;为全局最优结构;为第i粒子在第k次迭代过程中的所述位置坐标。
3.根据权利要2所述的基于多目标粒子群优化的蛋白质结构预测方法,其特征在于,所述S2步骤中,初始化每一所述目标粒子的所述更新速度为0,并对一最大迭代次数、所述惯性系数、所述认知系数和所述社会系数进行设置。
4.根据权利要3所述的基于多目标粒子群优化的蛋白质结构预测方法,其特征在于,所述目标能量公式包括Rosetta能量函数、QUARK能量函数和CHARMM能量函数。
5.根据权利要3或4所述的基于多目标粒子群优化的蛋白质结构预测方法,其特征在于,所述S3步骤进一步包括步骤:
S31:分别利用所述目标能量公式计算获得各所述初始粒子的一第一能量函数值、一第二能量函数值和一第三能量函数值;
S32:确定并选择各所述目标粒子中的非支配粒子,并将所述非支配粒子加入一更优解集;所述非支配粒子所对应的第一能量函数值为各所述第一能量函数值中的最小值,所述非支配粒子所对应的第二能量函数值为各所述第二能量函数值中的最小值,所述非支配粒子所对应的第三能量函数值为各所述第三能量函数值中的最小值,且所述第一能量函数值为各所述第一能量函数值中唯一的最小值或所述第二能量函数值为各所述第二能量函数值中唯一的最小值或所述第三能量函数值为各所述第三能量函数值中唯一的最小值;
S33:根据所述公式(1)更新各所述目标粒子所对应的所述更新速度;
S34:根据所述公式(2)更新各所述目标粒子的所述位置坐标;
S35:分别利用三所述目标能量公式计算获得各所述目标粒子的一所述第一能量函数值、一所述第二能量函数值和一所述第三能量函数值;
S36:确定并选择各当前所述目标粒子中的非支配粒子,并将该非支配粒子加入所述更优解集;
S37:判断迭代次数是否达到所述最大迭代次数;如否,返回步骤S33;如是,继续后续步骤。
6.根据权利要5所述的基于多目标粒子群优化的蛋白质结构预测方法,其特征在于,所述S4进一步包括步骤:
S41:构建一效用函数,U=λ1f1+λ2f2+λ3f3,其中f1为所述第一能量函数值、f2为所述第二能量函数值、f3为所述第三能量函数值,λ1为第一权重、λ2为第二权重、λ3为第三权重,λ1、λ2和λ3的取值范围分别为[0,1]且λ1+λ2+λ3=1;
S42:对λ1、λ2足够进行N次随机采样,计算所述更优解集中每个非支配粒子所对应的期望效用E(U);
选取数值最大的一所述期望效用所对应的一所述非支配粒子作为所属最优解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710244181.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有主轮和远侧辅助轮的自平衡板
- 下一篇:具有两方向投射的婴儿娱乐设备和系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用