[发明专利]一种基于局部有偏的蛋白质结构预测方法有效
| 申请号: | 202010803348.X | 申请日: | 2020-08-11 |
| 公开(公告)号: | CN111951885B | 公开(公告)日: | 2022-05-03 |
| 发明(设计)人: | 彭绍亮;陈健;王小奇;陈东;李肯立 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00;G06N3/12 |
| 代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 王文惠 |
| 地址: | 410012 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 局部 蛋白质 结构 预测 方法 | ||
本发明属于生物信息学、智能优化、计算机应用领域,公开了一种基于局部有偏的蛋白质结构预测方法。本发明包括步骤:计算目标个体变异窗口片段与片段库片段的疏水尺度差以及片段库中各片段的二级结构得分;对片段库中各片段统计并排序;选择最佳片段进行片段组装,通过蒙特卡洛机制判断是否接收以确定变异个体;计算变异个体与随机个体交叉片段的二级结构得分以确定交叉个体;通过随机数取值决定比较目标个体和交叉个体能量值或二级结构分数来选择下一代目标个体。本发明避免了传统构象空间优化方法的不足,如:采样效率低,预测精度较低。本发明借助于氨基酸疏水特性及其局部结构特征,实现了改进的结构模型评分方法。
技术领域:
本发明涉及生物信息学、智能优化、计算机应用领域,尤其涉及的是一种基于局部有偏的蛋白质结构预测方法。
背景技术:
蛋白质三级结构预测是结构生物学领域主要的研究问题之一。蛋白质是由20种不同的氨基酸残基组成的长序列,在特定条件下折叠成独特的三维结构,进而发挥其生物学功能。目前,利用计算机手段预测蛋白质结构已成为该领域的主流方法。从头预测就是从一维氨基酸序列出发,进而准确地预测蛋白质三维结构的方法之一,但其固有的构象搜索空间的复杂性和高维性是该方法最主要的瓶颈。
蛋白质的折叠过程非常复杂,在影响其折叠过程的因素中,氨基酸的疏水作用是主要作用之一,因此,考虑氨基酸的亲疏水性将有助于提高从头预测方法的采样效率。决定蛋白质结构的根本因素是其一维氨基酸序列,该序列通过盘曲折叠,形成具有一定空间结构的蛋白质分子,因此,蛋白质一级结构即一维氨基酸序列和二级结构信息的联合考量,将有助于进一步提高结构预测的效率和精度。
然而,现有的构象空间优化方法在预测精度和采样效率方面都存在着缺陷,因此,结合上述几点影响因素构建模型可以实现对现有方法的改进。
发明内容:
为了克服现有的蛋白质构象优化方法中采样效率低、预测精度较低的不足,本发明提出一种采样效率较高、预测精度高的基于局部有偏的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于局部有偏的蛋白质结构预测方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)利用PSIPRED平台预测目标蛋白的二级结构信息,利用ROSETTA平台构建片段库;
3)参数初始化:设置种群规模Ps,迭代计数器g,最大遗传代数Gmax,初始种群搜索轨迹长度N,交叉片段长度c,片段长度l,变异计数器T,最大计数值Tmax;
4)初始化种群:启动Ps条Monte Carlo轨迹,每条轨迹搜索N次,即生成Ps个初始个体;
5)对每个目标个体xi,i∈{i=1,.2..,Ps}进行如下操作:
5.1)对个体xi,进行变异操作:
5.1.1)随机产生一个整数d′∈[1,l-m],进而确定出个体xi的片段插入窗口[d′,m+d′],其中m是窗口大小;
5.1.2)根据公式计算窗口片段与片段库片段的疏水尺度差,其中是个体xi对应窗口片段中第i残基的疏水值,是片段库中片段第i残基的疏水值;
5.1.3)根据预测的二级结构,确定目标蛋白在对应窗口区域的二级结构Spre={seck|d′≤k≤d′+m},其中,seck∈{H,E,L}是预测的目标蛋白窗口区域第k个残基对应的二级结构类型,H,E,L分别代表α螺旋,β折叠和loop区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010803348.X/2.html,转载请声明来源钻瓜专利网。





