[发明专利]一种基于小生境局部增强的蛋白质构象采样方法在审
申请号: | 202110489364.0 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113362887A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 张贵军;夏瑜豪;魏源;刘俊;周晓根 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B15/00;G16B50/30 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 小生境 局部 增强 蛋白质 构象 采样 方法 | ||
一种基于小生境局部增强的蛋白质构象采样方法,在进化计算的框架下,首先,使用初始的能量函数对构象空间进行初步的搜索;其次,以每次迭代后得到的知识,避免对先前探索过的区域的重采样以得到多个具有潜力的低能区域;再次,构造一个基于距离的打分模型,在局部区域对种群进行增强;最后,输出每次迭代中距离打分最低的构象作为最后预测结果。本发明采用基于小生境局部增强的蛋白质构象采样方法,能够缓解传统多模态方法采样效率低,计算复杂度高的问题,从而提升整体预测精度。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于小生境局部增强的蛋白质构象采样方法。
背景技术
蛋白质是生命活动的主要承担者,几乎支撑着生命的所有功能,细胞内发生的大部分反应都依赖于蛋白质。蛋白质的工作方式和功能取决于它独特的三维结构,因此,获得其精确的三维结构对于理解蛋白质折叠机理、分析蛋白质功能、研发创新药物至关重要。2005年,《Science》杂志也将“能否预测蛋白质折叠?”列为21世纪125个最前沿的科学问题之一。
目前,生物湿实验是测定蛋白质三维结构的传统方法,例如X射线衍射、核磁共振、冷冻电镜等。但是,这些实验测定结构的方法耗时、费力、代价极高,远远不能满足高通量获取蛋白质结构的需求。因此,人们根据Anfinsen在1961年提出的结论,即蛋白质的氨基酸序列决定了其具有生物活性的空间排列,利用计算机技术预测蛋白质的三维结构。根据氨基酸序列预测蛋白质三维结构的方法主要有同源建模法和从头预测法。同源建模法利用结构已知的模板预测新序列的结构。这种方法需要首先得到比对程度较高的模板,若得到的模板质量不高,最终预测的蛋白质结构的精度将大打折扣。从头预测法不需要模板信息,直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。
蛋白质结构预测是一个高维、复杂的优化问题。由于能量模型的不精确,并且传统的采样算法极易陷入局部最优,因此这个问题极具挑战性。基于多模态的蛋白质构象采样方法通过同时获得多个令人满意的构象,在一定程度上缓解了能量函数不精确的问题,从而得到较可靠的预测模型。但是,这类方法也存在着采样效率低、计算复杂度高的问题。
因此,现有的蛋白质结构预测方法存在能量函数不精确、采样能力不足、采样效率低、预测精度不足等问题,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法的能量函数不精确、采样能力不足、采样效率低、预测精度较低的不足,本发明提供一种基于小生境局部增强的蛋白质构象采样方法,在进化计算的基础上,通过在局部使用基于距离的打分模型对种群进行进一步的增强,使其加速收敛,从而得到更符合天然态结构的模型,增强采样能力,提高采样效率,改善整体的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于小生境局部增强的蛋白质构象采样方法,所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA片段服务器获取3片段和9片段的片段库文件,从trRosetta服务器获取距离分布文件;
3)设置参数:最大迭代次数G,种群规模NP,小生境半径r,降级函数系数α,基于能量的接收概率温度比例因子β1,基于距离的接收概率温度比例因子β2;
4)设置g=1,g∈{1,2,...,G};
5)种群初始化:随机片段组装生成NP个初始构象Ci,i∈{1,2,...,NP};
6)对种群中的每个个体Ci,i∈{1,2,...,NP}进行如下操作:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110489364.0/2.html,转载请声明来源钻瓜专利网。