[发明专利]一种蛋白质结构预测算法评价指标构建方法有效
申请号: | 201810238748.3 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108563921B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张贵军;谢腾宇;王柳静;王小奇;郝小虎;周晓根 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种蛋白质结构预测算法评价指标构建方法,利用Rosetta Abinitio协议对搜索空间进行搜索,通过对背景点的聚类找到潜在天然态区域;然后,执行待评价预测算法的迭代过程,分析每一代种群的进化状态;其次,计算种群前后两代的状态转移矩阵并用香农熵量化种群状态变化情况;最后,记录历代熵值,从而反应算法在蛋白质结构预测的作用。本发明提供一种蛋白质结构预测算法评价指标构建方法,一方面,在一定程度上直观反映算法在预测过程中的所处的状态,另一方面,利用熵值可以比较多个算法在预测中起到的作用。 | ||
搜索关键词: | 一种 蛋白质 结构 预测 算法 评价 指标 构建 方法 | ||
【主权项】:
1.一种蛋白质结构预测算法评价指标构建方法,其特征在于:所述评价指标构建方法包括以下步骤:1)给定输入序列信息,利用Robetta服务器获得该序列的片段库;2)对搜索空间初步探索并建立Markov状态模型,过程如下:2.1)获取m个背景点:运行Rosetta Abinitio协议m次,记录每次运行的构象结果,作为背景点;2.2)计算m个背景点之间的方均根差距离,组成距离矩阵D;2.3)根据距离矩阵D,利用k‑mediods聚类方法对m个背景点分类,得到k个簇心,作为k个Markov状态,其中ki,i∈{1,...,m}分类:计算背景点与k个簇心的距离
则该背景点所属类别号为ci,ci满足条件
ci∈{1,...,k};2.3.3)找出每一类别背景点的簇心,计算每个点距离同一类别其他所有点的距离之和,距离之和最短的对应点为该类的簇心;2.3.4)如果簇心改变,则返回步骤2.3.2),继续聚类迭代过程;否则,簇心不变,执行下一步;3)评价基于种群的蛋白质结构预测方法,过程如下:3.1)对初始化种群进行分类,表示初始状态:种群规模为NP,种群表示为P={C1,C2,...,CNP},Cn,n∈{1,...,NP}为第n个种群个体,计算个体Cn与k个簇心的均方根偏差(RMSD)距离,若Cn与第p个簇心距离最近,那么该个体当前状态staten=p,p∈{1,...k},表明个体Cn属于第p类,整个种群的状态表示为statelast={state1,state2,...,stateNP},statelast表示上一代种群状态;3.2)对种群执行下一次迭代过程得到下一代种群,其中迭代过程的步骤由算法决定;3.3)计算当前种群状态:对当前种群中个体Cn,n∈{1,...,NP}分类,计算个体Cn与k个簇心的RMSD距离,若Cn与第q个簇心距离最近,那么该个体当前状态state′n=q,q∈{1,...k},表明个体Cn属于第q类,整个种群的状态表示为state′now={state′1,state′2,...,state′NP},state′now表示当前种群状态;3.4)根据前后两代的状态统计得出Markov状态转移矩阵T:对构象Cn,n∈{1,...,NP}的前后两次状态staten=p和state′n=q表明一次从状态p到状态q的转移,则tpq=tpq+1/k,tpq为矩阵T第p行第q列的数值,表示该状态转移频率,其初始值为0;3.5)根据状态转移矩阵T计算香农熵值Entropy=∑‑tpqlntpq;3.6)更新当前种群状态statelast=statenow;3.7)判断算法迭代过程是否结束,若结束,输出最后预测结果和历代熵值并结束以上步骤;否则,返步骤3.2)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810238748.3/,转载请声明来源钻瓜专利网。