[发明专利]一种基于二级结构空间距离约束的蛋白质构象搜索方法有效
申请号: | 201710683896.1 | 申请日: | 2017-08-11 |
公开(公告)号: | CN107609342B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 张贵军;王小奇;马来发;周晓根;谢腾宇;王柳静;孙科 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二级 结构 空间 距离 约束 蛋白质 构象 搜索 方法 | ||
一种基于二级结构空间距离约束的蛋白质构象搜索方法,在遗传算法的基本框架下,利用目标蛋白中每个二级结构的空间长度以及相邻两个二级结构中心残基间的空间距离信息构成特征向量作为空间限制条件,使得在给定能量函数的条件下,在一个较小的构象空间中搜索解空间,同时在选择算子中加入了空间距离信息,弥补了能量函数的不精确性,进而有效提高了结构建模的精确度。本发明提出一种采样效率较高、预测精度较高、计算代价低的基于二级结构空间距离约束的蛋白质构象搜索方法。
技术领域
本发明涉及一种生物学信息学、人工智能优化、计算机应用领域,尤其涉及的是一种基于二级结构空间距离约束的蛋白质构象搜索方法。
背景技术
蛋白质是由氨基酸脱水缩合形成的生物大分子,对人类的健康起着决定性作用,准确掌握蛋白质的结构和功能对疾病研究、生物制药等方面都有重要意义。目前蛋白质结构预测的方法主要有两种:实验方法和理论预测。实验方法包括X射线晶体学、核磁共振光谱、和电子显微镜等;虽然这些方法能够准确地测定某些蛋白质的三维结构,但是通过实验的方法来测定结构是耗时且昂贵的,同时有些蛋白质的结构通过实验方法根本无法获得。所以,利用计算的方法来预测蛋白质结构已成为生物信息学研究中的热点。理论预测方法主要利用计算机技术和智能优化算法从氨基酸一级序列来预测蛋白质三维结构,从而有效的节约了预测成本,减少了预测时间,因此这类方法相比于实验方法更能得到广泛应用。但由于蛋白质结构本身的复杂性,到目前为止蛋白质三维结构的预测问题仍是一个有待解决的难题。
在从头预测蛋白质结构的方法中,进化算法是研究蛋白质分子构象优化的重要方法,例如遗传算法、差分进化等算法,这些算法拥有收敛速度快、结构简单以及鲁棒性强等优点。然而,当蛋白质序列比较长时,因构象空间太大,如果按照特定的能量函数来搜索,由于能量函数的不精确性,并不能保证所找到的能量最小的构象最接近天然态结构,因此往往不能形成正确的折叠。
因此,现有的构象空间搜索方法在预测精度和采样效率方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测构象空间搜索方法存在采样效率较低、预测精度较低的不足,本发明提出一种采样效率较高、预测精度较高的基于二级结构空间距离约束的蛋白质构象搜索方法。
本发明解决其技术问题所采用的技术方案是:
一种基于二级结构空间距离约束的蛋白质构象搜索方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模NP,最大遗传代数Gmax,确定交叉概率Pc,初始种群迭代次数iteration,交叉片段长度frag_length,组装计数器reject_number,最大组装次数reject_max,先验知识中二级结构的空间长度以及相邻两个二级结构中心残基间的空间距离构成的特征向量D={d1,…,dm,d1,2,…,dk,k+1},其中dm是目标蛋白的第m个二级结构块的长度,dk,k+1是第k个二级结构块和第k+1个二级结构中心残基的空间距离,最大距离约束范围δ,选择概率Ps;
3)初始化种群:启动NP条Monte Carlo轨迹,每条轨迹搜索iteration次,即生成NP个初始个体;
4)对每个目标个体xi和随机选取的个体xj进行如下操作,i,j∈(1,...,NP)且j≠i:
4.1)按概率Pc对个体xi和xj进行交叉操作,过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710683896.1/2.html,转载请声明来源钻瓜专利网。