[发明专利]一种非核糖体蛋白质-RNA复合物近天然结构的筛选方法在审
申请号: | 201310400300.4 | 申请日: | 2013-09-05 |
公开(公告)号: | CN103500293A | 公开(公告)日: | 2014-01-08 |
发明(设计)人: | 李春华;张弘古村;刘斌;谢小露;张蕾;谭建军;张小轶;王存新 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种非核糖体蛋白质-RNA复合物近天然结构的筛选方法,属于蛋白质-RNA分子对接复合物结构预测领域。首先,通过构象搜索获得蛋白质-RNA各种可能的结合模式;然后,对其合理性进行评价,其间综合考虑了蛋白质-RNA分子间的静电和范德华相互作用能,以及复合物界面上氨基酸-核苷酸成对偏好势。各项的权重是通过采用线性回归的方法,来对对接结构的配体均方根偏差和其能量项的加权组合值进行拟合得到的;最后,根据分值从小到大进行排序,从而判断近天然结构。该方法在非核糖体蛋白质-RNA分子对接近天然结构的筛选中有很好的效果,成功率较高,可用于该类蛋白质-RNA复合物结构预测领域,为分子改造和设计提供重要的依据。 | ||
搜索关键词: | 一种 核糖体 蛋白质 rna 复合物 天然 结构 筛选 方法 | ||
【主权项】:
1.一种非核糖体蛋白质-RNA复合物近天然结构的筛选方法,其特征在于,包括以下步骤: 步骤(1): 采用FTDock软件对蛋白质-RNA结合模式进行构象搜索;只是利用了FTDock中的快速傅里叶变换搜索方法进行构象搜索; 步骤(2): 对步骤(1)获得的结合模式进行分值计算,该分值是一个加权组合打分函数的结果,打分函数为: 分值=0.01017×Eelesa+0.01198×Eelesr+0.01148×Eelela+0.01071×Eelelr+0.02421×Vattr+0.00215×Vrep+0.12786×Erp (1) 其中,Eelesa,Eelesr,Eelela,Eelelr,Vattr,Vrep,Erp依次代表静电短程吸引、静电短程排斥、静电长程吸引、静电长程排斥、范德华吸引、范德华排斥和氨基酸-核苷酸成对偏好势;下面列出各项具体的计算公式。 静电相互作用能为:
其中,qi,qj分别代表原子i和j的电荷,根据原子类型及其所在的氨基酸和核苷酸类型从AMBER力场参数中获取;rij代表原子i与原子j之间的距离,通过原子的空间坐标得到;当rij小于
时,则取
若Eele<0则为吸引,Eele>0则为排斥;若
则为短程作用,
则为长程作用;范德华吸引和排斥相互作用能分别为: ![]()
其中,rij代表原子i与原子j之间的距离,rm,ij代表原子i与原子j的范德华半径之和,εij是原子i,j势阱深度乘积的平方根,范德华半径及原子势阱深度可根据原子类型及其所在的氨基酸和核苷酸类型从AMBER力场中获取; 60×8氨基酸-核苷酸成对偏好势为:
其中,R为普适气体常数,T为绝对温度,这里取RT=0.59kcal/mol;Pab为考虑了复合物类型及蛋白质和RNA二级结构信息的氨基酸a与核苷酸b之间的成对偏好性,具体Pab的数值见表1;这里氨基酸为60种,核苷酸为8种,在分值计算中只需根据氨基酸类型和核苷酸类型,直接在矩阵中找到对应的Pab的值; 表1.60×8氨基酸-核苷酸成对偏好性 ![]()
表1.(继续)
表1.(继续)
表1.(继续)
c:蛋白质二级结构被分为三类X,Y,Z; d:RNA二级结构被分为两类M,N; 根据以上公式(1)-(5),对蛋白质-RNA构象搜索中获得的结合模式进行分值计算,分别获得其分值; 步骤(3): 对结合模式所得分值由低到高进行排序,近天然结构包含在分值最低的前2000个结合模式中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310400300.4/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用