[发明专利]一种基于模板自适应选择的多域蛋白结构组装方法有效
申请号: | 201710757199.6 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107609345B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 张贵军;周晓根;王柳静;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于模板自适应选择的多域蛋白结构组装方法,首先,利用蛋白质比对工具对多域蛋白库的中各模板进行打分,并根据打分进行降序排名;然后,选择出排名靠前的部分模板进行组装,并对每个模板设置一个选择概率;其次,在组装过程中,每隔一定的阶段,根据各模板组装得到的结构被成功接收的次数和该模板被选择的次数动态更新各模板被选择的概率;最后,在每次迭代中,根据各模板的选择概率,利用轮盘赌选择出一个模板产生的结构进行随机选择和平移,从而产生新的结构。本发明提供一种计算代价较低、预测精度较高的基于模板自适应选择的多域蛋白结构组装方法。 | ||
搜索关键词: | 一种 基于 模板 自适应 选择 蛋白 结构 组装 方法 | ||
【主权项】:
一种基于模板自适应选择的多域蛋白结构组装方法,其特征在于:所述多域蛋白结构组装方法包括以下步骤:1)输入各单域蛋白的三维结构;2)设置组装模板数量T,最大迭代次数Imax,冲突距离阈值dcl,相互作用阈值dct,各模板的选择概率pt,t=1,2,...,T,pt表示第t个模板的选择概率,学习间隔Iinter;3)利用模板比对工具TM‑align对多域蛋白库中的每个模板进行打分,并根据打分进行降序排列;4)选出打分最高的前T个模板进行组装,过程如下:4.1)将各单域蛋白重叠到各个模板上,得到T个结构,并根据如下公式对各结构进行打分:E=w1Σd(Xin,Xjn+1)<dc11d(Xin,Xjn+1)+w2Σl=1Ld(Xl,XlTemp)L+w311+N(d(Xin,Xjn+1)<dct)/n0+w4Σn=1Dd(Xlnn,X1n+1)]]>其中,w1、w2、w3和w4为各能量项的权重,和分别表示第n个单域蛋白的第i个Ca原子的坐标和第n+1个单域蛋白的第j个Ca原子的坐标,表示和之间的欧氏距离,Xl和分别表示组装结构中第l个Ca原子的坐标和各域重叠到模板上后整个多域蛋白结构的第l个Ca原子的坐标,为Xl和之间的欧氏距离,L为蛋白的序列长度,为距离相互作用阈值dct的Ca原子数量,n0为归一化常数,其取值为0.306×(ln+ln+1),ln和ln+1分别为第n个单域蛋白和第n+1个单域蛋白的序列长度,和分别表示第n个单域蛋白的最后一个Ca原子的坐标和第n+1个单域蛋白的第一个Ca原子的坐标,为他们之间的欧氏距离,D表示单域蛋白的总数量;4.2)根据各模板的选择概率,利用轮盘赌选择出一个模板得到的结构,并根据4.1)计算其得分Eold;4.3)对4.2)中选择的结构中所有的Ca原子坐标进行随机选择和平移,从而得到一个新的结构,并根据4.1)计算新结构的得分E;4.4)如果E小于Eold,则新结构替换当前模板的结构;否则,如果满足则新结构替换当前模板的结构,并记录当前的迭代次数以及被接收的所有新结构,其中rand(0,1)为0和1之间的随机数,e为自然常数;4.5)如果当前迭代次数是否为Iinter的整数倍,则计算各目标的选择概率pt,t=1,2,...,T,其值等于第t个模板产生的结构成功替换的次数除以第t个模板在步骤4.2)中被选择的次数;4.6)如果迭代次数达到最大迭代次数Imax,则继续步骤5),否则重复步骤4.2)~4.6);5)利用近天然态蛋白聚类工具SPICKER对迭代过程中所有被接收的新结构进行聚类,从而选择出规模最大的类的中心结构为最终组装结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710757199.6/,转载请声明来源钻瓜专利网。
- 上一篇:可变剪切分析方法
- 下一篇:基因组IIB型限制内切酶位点预测方法及电子设备