[发明专利]一种基于树结构副本交换和片段组装的蛋白质结构预测方法在审
申请号: | 201410353661.2 | 申请日: | 2014-07-23 |
公开(公告)号: | CN104200130A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 张贵军;秦传庆;周晓根;郝小虎;梅珊;陈先跑;李章维 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于树结构副本交换和片段组装的蛋白质结构预测方法,包括以下步骤:将蛋白质构象依据副本交换思想,从而在利于保留多个副本的信息基础上,增强对蛋白质构象空间的搜索,利用树数据结构的优势,加上使用能量分层和蛋白质中间构象的形状信息,并且采用特定的权重函数来对整个蛋白质构象空间的分别采用一定的概率来选定作为编译的副本,导向蛋白质构象朝能量低的路径步进,并且尽量保留蛋白质构象的多样性,达到最终预测蛋白质自然态的目的。本发明可以大大减少计算量,缩短计算时间,同时保证搜索到能量较低的构象。 | ||
搜索关键词: | 一种 基于 结构 副本 交换 片段 组装 蛋白质 预测 方法 | ||
【主权项】:
一种基于树结构副本交换和片段组装的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:A1、蛋白质构象处理,过程如下:STEP1.1、根据获得的蛋白质氨基酸序列使用Rosetta套装软件pose_from_sequence函数构建蛋白质长链;STEP1.2、并将获取的蛋白质长链使用Rosetta构建的Mover对象SwitchResidueTypeSetMover,使用其apply方法将构建的蛋白质长链的全原子构象转换成骨链原子构象,该蛋白质构象用pose表示;STEP1.3、将上述转换完成pose使用随机数分别给定每个氨基酸位置的(α,β,ω);STEP1.4、将上述的STEP1.1、STEP1.2、STEP1.3步骤执行n次,n是副本总数;A2、片段库构建,过程如下:STEP2.1、将蛋白质的序列提交到提供根据特定序列产生片段库的服务器网站,服务器处理完成之后返回特定的片段库文件;STEP2.2、使用Rosetta软件套装构建的Mover对象ClassicFragmentMover,根据获得的片段库文件构建此对象;A3、温度参数KT列表设置,过程如下:STEP3.1、根据副本数目,设定相同数目的KT列表的大小;STEP3.2、使用Rosetta提供的score3力场模型构建能量函数scorefxn;STEP3.3、根据KT列表和pose对象以及scorefxn实例化Rosetta软件套装提供的MonteCarlo对象,组成一个列表mc,其大小和KT列表相同;A4、蛋白质构象的能量计算,过程如下:STEP4.1、采用上述的scorefxn计算pose对象得到能量值;STEP4.2、根据上述求得的能量值进行分层处理,具体是根据蛋白质的能量分布,进行层处理,本程序按照两个能量单位一层进行处理,根据能量值得到本pose对象所处的能量空间的位置;A5、蛋白质形状特征提取,过程如下:STEP5.1、首先传入蛋白质对象;STEP5.2、从上述对象里面提取出来各个采样点的坐标,所述坐标是三维的笛卡尔坐标,假定采样点的坐标共有n个;STEP5.3、由公式(1)求得上述对象的质心坐标,即几何中心坐标centroid(x,y,z);x=1nΣi=1nxiy=1nΣi=1nyiz=1nΣi=1nzi---(1)]]>STEP5.4、由公式(2)迭代求得离上述对象的质心坐标centroid(x,y,z)最远的采样点坐标farest(x,y,z);Distance=((xi-x)2+(yi-y)2+(zi-z)2)---(2)]]>STEP5.5、由公式(2)迭代求得离上述对象的质心坐标centroid(x,y,z)最远的采样点坐标farest_farest(x,y,z);STEP5.6、分别由公式(3)迭代求得各个采样点与centroid(x,y,z)的平均距离CentroidAverage;CentroidAverage=Σi=14n((xi-x)2+(yi-y)2+(zi-z)2)/(4n)---(3)]]>STEP5.7、分别由公式(4)迭代求得各个采样点与farest(x,y,z)的平均距离FarestAverageFarestAverage=Σi=14n((xi-x)2+(yi-y)2+(zi-z)2)/(4n)---(4)]]>STEP5.8、分别由公式(5)迭代求得各个采样点与farest_farest(x,y,z)的平均距离FarestFarestAverageFarestFarestAverage=Σi=14n((xi-x)2+(yi-y)2+(zi-z)2)/(4n)---(5)]]>STEP5.9、将上述STEP5.6、5.7和5.8步骤之中获得的每个分量组成一个三维向量(6),这个三维向量就代表了当前这个对象的特征向量;FeatureVectorq=(CentroidAverage,FarestAverage,FarestFarestAverage) (6)STEP5.10、将上述的三维向量中的每一维按照tick大小取定维度形成一个小的格子,这个格子代表了本蛋白质对象在形状空间上所处的位置;A6、根据上述求得的能量层位置和形状空间位置存储初始构象对象,将构象存储到树结构的特定位置采用同样的方法构建n个此种类型的树结构;A7、蛋白质的构象的扰动;A8、将内存中的蛋白质构象的信息用文件的形式保存到电脑磁盘,并将相应的数据用散点图的形式输出,并输出最好的蛋白质构象。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学;,未经浙江工业大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410353661.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种构象空间动态步长搜索方法
- 下一篇:一种铅锌冶炼污染减排技术集成方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用