[发明专利]基于多目标粒子群优化的蛋白质结构预测方法在审
申请号: | 201710244181.6 | 申请日: | 2017-04-14 |
公开(公告)号: | CN107025383A | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 沈红斌;耿玲 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18;G06F19/16 |
代理公司: | 上海伯瑞杰知识产权代理有限公司31227 | 代理人: | 李庆 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多目标 粒子 优化 蛋白质 结构 预测 方法 | ||
技术领域
本发明涉及生物医学领域,尤其涉及一种基于多目标粒子群优化的蛋白质结构预测方法。
背景技术
蛋白质结构指的是三级结构,即指一条多肽链在二级结构或者结构域的基础上,进一步盘绕、折叠,依靠次级键的维系固定所形成的特定空间结构。研究蛋白质结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。目前通过实验方法确定蛋白质结构的过程仍然非常复杂,代价较高,需要耗费大量的成本和时间。近年来数据采集技术的飞速发展产生了海量的生物数据,因此需要发展计算性的方法来预测蛋白质结构,弥补生物数据产生能力和理解速度之间的差距。
蛋白质结构预测优化是指将初始的、精度不高的预测结构通过合适的搜索优化方法得到精度更高的蛋白质结构。当前蛋白质结构优化的方法主要可以分为两类:基于分子动力学模拟和蒙特卡洛模拟方法。基于分子动力学模拟的优化方法的基本原理是应用立场函数所描述的分子内和分子间相互作用,根据牛顿运动力学计算蛋白质在相空间中的轨迹,搜索出力场最低态。这种方法的精确性主要依赖于力场函数的精确性和模拟时间的长短。基于蒙特卡洛模拟的基本思想是使用玻尔兹曼分布函数实现在能量空间的搜索,同样也依赖于能量函数的精确性。
在蛋白质结构预测优化中,不论是基于分子动力学模拟还是蒙特卡洛模拟都依赖于力场函数或能量函数的精确性,但是目前我们缺乏准确的能量函数来有效的搜索。对于蛋白质而言,分子的力场包含许多参数包括原子的电荷、分子间的作用势等,由于复杂性导致目前存在的很多立场函数和能量函数没有能够得到广泛的应用。在蛋白质结构预测中,我们通过分子动力学模拟或者蒙特卡洛模拟等方法来搜索能量最低态的结构,而能量最低态的结构通常是接近于原始结构的,所以如果描述蛋白质结构能量的能量函数不准确,那么就难以搜索到接近于原始结构的状态。
发明内容
针对上述现有技术中的不足,本发明提供一种基于多目标粒子群优化的蛋白质结构预测方法,采用多目标粒子群方法,针对力场函数或能量函数不准确的问题采用两个能量函数进行多目标搜索,具有有效性高和预测准确性高的优点。
为了实现上述目的,本发明提供一种基于多目标粒子群优化的蛋白质结构预测方法,包括步骤:
S1:在一待预测的蛋白质序列中选择需要优化的n个不同初始结构作为n个目标粒子,并将每一所述目标粒子的位置坐标以构象表示的形式表示,n为大于零的自然数;
S2:对一更新公式进行参数设置;
S3:根据所述更新公式对三目标能量公式进行迭代,并获得一更优解集;
S4:处理所述最优解集获得一最优解,并将所述最优解作为所述目标粒子的预测位置。
优选地,所述更新公式包括公式(1)和公式(2):
其中,w为惯性系数,k为迭代次数,c1为认知系数,c2为社会系数;为更新速度,所述更新速度表示第i粒子在第k次迭代过程中相比上一次迭代过程中改变结构的速度;rand为0~1之间的随机数;为历史最优结构;为全局最优结构,为第i粒子在第k次迭代过程中的所述位置坐标。
优选地,所述S2步骤中,初始化每一所述目标粒子的所述更新速度为0,并对一最大迭代次数、所述惯性系数、所述认知系数和所述社会系数进行设置。
优选地,所述目标能量公式包括Rosetta能量函数、QUARK能量函数和CHARMM能量函数。
优选地,所述S3步骤进一步包括步骤:
S31:分别利用所述目标能量公式计算获得各所述初始粒子的一第一能量函数值、一第二能量函数值和一第三能量函数值;
S32:确定并选择各所述目标粒子中的非支配粒子,并将所述非支配粒子加入一更优解集;所述非支配粒子所对应的第一能量函数值为各所述第一能量函数值中的最小值,所述非支配粒子所对应的第二能量函数值为各所述第二能量函数值中的最小值,所述非支配粒子所对应的第三能量函数值为各所述第三能量函数值中的最小值,且所述第一能量函数值为各所述第一能量函数值中唯一的最小值或所述第二能量函数值为各所述第二能量函数值中唯一的最小值或所述第三能量函数值为各所述第三能量函数值中唯一的最小值;
S33:根据所述公式(1)更新各所述目标粒子所对应的所述更新速度;
S34:根据所述公式(2)更新各所述目标粒子的所述位置坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710244181.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有主轮和远侧辅助轮的自平衡板
- 下一篇:具有两方向投射的婴儿娱乐设备和系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用