[发明专利]一种基于树结构副本交换和片段组装的蛋白质结构预测方法在审

专利信息
申请号: 201410353661.2 申请日: 2014-07-23
公开(公告)号: CN104200130A 公开(公告)日: 2014-12-10
发明(设计)人: 张贵军;秦传庆;周晓根;郝小虎;梅珊;陈先跑;李章维 申请(专利权)人: 浙江工业大学
主分类号: G06F19/16 分类号: G06F19/16
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于树结构副本交换和片段组装的蛋白质结构预测方法,包括以下步骤:将蛋白质构象依据副本交换思想,从而在利于保留多个副本的信息基础上,增强对蛋白质构象空间的搜索,利用树数据结构的优势,加上使用能量分层和蛋白质中间构象的形状信息,并且采用特定的权重函数来对整个蛋白质构象空间的分别采用一定的概率来选定作为编译的副本,导向蛋白质构象朝能量低的路径步进,并且尽量保留蛋白质构象的多样性,达到最终预测蛋白质自然态的目的。本发明可以大大减少计算量,缩短计算时间,同时保证搜索到能量较低的构象。
搜索关键词: 一种 基于 结构 副本 交换 片段 组装 蛋白质 预测 方法
【主权项】:
一种基于树结构副本交换和片段组装的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:A1、蛋白质构象处理,过程如下:STEP1.1、根据获得的蛋白质氨基酸序列使用Rosetta套装软件pose_from_sequence函数构建蛋白质长链;STEP1.2、并将获取的蛋白质长链使用Rosetta构建的Mover对象SwitchResidueTypeSetMover,使用其apply方法将构建的蛋白质长链的全原子构象转换成骨链原子构象,该蛋白质构象用pose表示;STEP1.3、将上述转换完成pose使用随机数分别给定每个氨基酸位置的(α,β,ω);STEP1.4、将上述的STEP1.1、STEP1.2、STEP1.3步骤执行n次,n是副本总数;A2、片段库构建,过程如下:STEP2.1、将蛋白质的序列提交到提供根据特定序列产生片段库的服务器网站,服务器处理完成之后返回特定的片段库文件;STEP2.2、使用Rosetta软件套装构建的Mover对象ClassicFragmentMover,根据获得的片段库文件构建此对象;A3、温度参数KT列表设置,过程如下:STEP3.1、根据副本数目,设定相同数目的KT列表的大小;STEP3.2、使用Rosetta提供的score3力场模型构建能量函数scorefxn;STEP3.3、根据KT列表和pose对象以及scorefxn实例化Rosetta软件套装提供的MonteCarlo对象,组成一个列表mc,其大小和KT列表相同;A4、蛋白质构象的能量计算,过程如下:STEP4.1、采用上述的scorefxn计算pose对象得到能量值;STEP4.2、根据上述求得的能量值进行分层处理,具体是根据蛋白质的能量分布,进行层处理,本程序按照两个能量单位一层进行处理,根据能量值得到本pose对象所处的能量空间的位置;A5、蛋白质形状特征提取,过程如下:STEP5.1、首先传入蛋白质对象;STEP5.2、从上述对象里面提取出来各个采样点的坐标,所述坐标是三维的笛卡尔坐标,假定采样点的坐标共有n个;STEP5.3、由公式(1)求得上述对象的质心坐标,即几何中心坐标centroid(x,y,z);x=1nΣi=1nxiy=1nΣi=1nyiz=1nΣi=1nzi---(1)]]>STEP5.4、由公式(2)迭代求得离上述对象的质心坐标centroid(x,y,z)最远的采样点坐标farest(x,y,z);Distance=((xi-x)2+(yi-y)2+(zi-z)2)---(2)]]>STEP5.5、由公式(2)迭代求得离上述对象的质心坐标centroid(x,y,z)最远的采样点坐标farest_farest(x,y,z);STEP5.6、分别由公式(3)迭代求得各个采样点与centroid(x,y,z)的平均距离CentroidAverage;CentroidAverage=Σi=14n((xi-x)2+(yi-y)2+(zi-z)2)/(4n)---(3)]]>STEP5.7、分别由公式(4)迭代求得各个采样点与farest(x,y,z)的平均距离FarestAverageFarestAverage=Σi=14n((xi-x)2+(yi-y)2+(zi-z)2)/(4n)---(4)]]>STEP5.8、分别由公式(5)迭代求得各个采样点与farest_farest(x,y,z)的平均距离FarestFarestAverageFarestFarestAverage=Σi=14n((xi-x)2+(yi-y)2+(zi-z)2)/(4n)---(5)]]>STEP5.9、将上述STEP5.6、5.7和5.8步骤之中获得的每个分量组成一个三维向量(6),这个三维向量就代表了当前这个对象的特征向量;FeatureVectorq=(CentroidAverage,FarestAverage,FarestFarestAverage)   (6)STEP5.10、将上述的三维向量中的每一维按照tick大小取定维度形成一个小的格子,这个格子代表了本蛋白质对象在形状空间上所处的位置;A6、根据上述求得的能量层位置和形状空间位置存储初始构象对象,将构象存储到树结构的特定位置采用同样的方法构建n个此种类型的树结构;A7、蛋白质的构象的扰动;A8、将内存中的蛋白质构象的信息用文件的形式保存到电脑磁盘,并将相应的数据用散点图的形式输出,并输出最好的蛋白质构象。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学;,未经浙江工业大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410353661.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top