[发明专利]一种基于多种群遗传算法的一般蛋白质设计方法在审
申请号: | 202210812579.6 | 申请日: | 2022-07-11 |
公开(公告)号: | CN115394351A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 广红;王威丹;宋加磊 | 申请(专利权)人: | 青岛超蓝生物信息科技有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B15/20;G06N3/12 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266000 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多种 遗传 算法 一般 蛋白质 设计 方法 | ||
1.一种基于多种群遗传算法的一般蛋白质设计方法,所述蛋白质设计方法包括一个最优化模型P1,通过分析蛋白质联合残基力场,并采用能量项建立蛋白质结构预测模型,在联合残基力场模型中,氨基酸的侧链用一个椭球体来表示,氨基酸序列的主链被简化为一系列用虚键Ca-Ca连接的a碳原子Ca,每个a碳原子接一个联合侧链SC,肽单位用两个a碳原子之间的一个联合肽基P表示;其中只有SC和P为作用点,Ca仅辅助确定作用点的几何位置;虚键C0-C0键长固定不变,侧链键Ca-SC键长仅跟残基类型有关,自由变量为:虚键二面角γ、虚键键角θ和侧链键角αSC和βSC,在蛋白质结构中,两个C0原子之间形成一个肽单元,一条多肽链由多个肽单元连接而成,联合残基力场模型用一个虚拟的肽基表示一个肽单元,肽基之间主要考虑静电相互作用,联合肽基之间的相互作用能;这个势能越小,对蛋白质结构的刻画越准确,对于所有的球状蛋白质,大多数疏水侧链埋藏在蛋白质内部,形成疏水内核,亲水侧链则主要分布在蛋白质表面,这是蛋白质空间结构的一个最显著的特点,侧链间相互作用主要表示侧链之间的疏水和亲水作用,同时,为了防止一个残基的侧链与另一个残基的主链靠得太近所造成的不合理结构,联合侧链SCi与联合肽基Pj之间的相互作用能不小于一定的标准;其特征是:
所述最优化模型P1为:
(P1)
其中,是决策变量,N为蛋白质序列残基的个数;表示联合侧链SCi与SCj之间的相互作用能,包含了侧链间疏水/亲水作用的平均自由能,用i,j分别表示SCi和SCj,cij为常实数,有
其中εij和xij都与侧链的类型、位置及方向有关的常数,
其中rij为侧链中心的距离,σij由下式决定:
和为单位向量,其它参数都只与残基类型有关。
2.根据权利要求1所述的基于多种群遗传算法的一般蛋白质设计方法,其特征是:联合侧链sci与联合肽基pj之间的相互作用能表示为该项是为了防止一个残基的侧链与另一个残基的主链靠得太近所造成的不合理的结构而加入的惩罚项;对于相邻的两个残基,忽略不计,当第i个残基和第j个残基不相邻时,通过下式计算:
其中,rij表示残基i和残基j之间的距离εscp=0.3kcal/mol;
3.根据权利要求1所述的基于多种群遗传算法的一般蛋白质设计方法,其特征是:是联合肽基之间的相互作用能,具体表达式为
其中,αij,βij,γij是定义肽基Pi,Pj相对位置的角度,是常数,是定义肽基Pi,Pj之间的距离。
4.根据权利要求2或3所述的基于多种群遗传算法的一般蛋白质设计方法,其特征是:将约束分为两部分,令
所述最优化模型P1重新表述为:
采用光滑惩罚技术,将改进后的所述最优化模型P1转化为具有简单约束的最优化模型P2,具体形式如下:
(P2)
其中,M>0是罚参数。
5.根据权利要求4所述的基于多种群遗传算法的一般蛋白质设计方法,其特征是:针对所述最优化问题P2提出了一种新的遗传算法,可以有效处理高维的连续函数优化问题,并能快速地收敛到全局最优解,将所述最优化问题P2的决策变量规范化,并利用如下规则处理决策变量x的每个分量xr的边界,r是正整数:
经此式处理后,决策变量的任意一个分量的值都在规定的范围内,且分量值符号保持不变,并约定决策变量的维数为n;
在所述最优化模型P2的基础上,采用一个多种群遗传算法来预测蛋白质三维结构,所述多种群遗传算法描述如下:
第一步:随机产生N1个决策变量作为初始种群,以高斯坐标为染色体编码方式,并确定初始参数;
第二步:计算每个构象,即,染色体,被选择进行遗传操作的概率,并约定依据这个概率进行随机选择;在选择时尽量将适应度高的个体进入下一代;首先按着适应度排序,计算个体之间的距离,选择距离最近的个体比较能量值,将能量值最低的个体删除,依次循环,直到选出前90%的个体;
第三步:利用交叉算子和变异算子对选定的所述构象进行交叉和变异操作,并产生新的种群,采用簇间交叉和簇内交叉,簇间交叉时,将所有种群簇的簇首进入交叉池,两两个体作为交叉父代进行交叉,簇内交叉时,在种群中按着概率选择离簇首尽可能远的个体进入交叉池,将交叉池中个体与簇首进行交换信息;变异算子采用多点变异算子,从而更有利于寻求全局最优解;
第四步:若不满足停止准则,则重复第二步到第三步;否则,输出种群中能量值最小的构象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛超蓝生物信息科技有限公司,未经青岛超蓝生物信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210812579.6/1.html,转载请声明来源钻瓜专利网。