[发明专利]一种基于模拟退火算法的假结RNA结构预测方法在审
申请号: | 202210812578.1 | 申请日: | 2022-07-11 |
公开(公告)号: | CN115394350A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 宋加磊;广心升;刘凤永 | 申请(专利权)人: | 青岛超蓝生物信息科技有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266000 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模拟 退火 算法 rna 结构 预测 方法 | ||
1.一种基于模拟退火算法的假结RNA结构预测方法,所述假结RNA结构预测方法涉及RNA二级结构及其自由能,所述RNA二级结构包含一种梯子结构,所述RNA二级结构的自由能能根据近邻热力学参数计算出来,随着RNA序列长度的增加,二级结构候选解的数量也呈指数量级增加,所述梯子结构指的是一组依次连续匹配的核苷酸,形成一种梯子状的结构,对于带假结RNA二级结构的预测用到生物信息学中的评价参数:敏感性SE和特异性SP,预测结果中,敏感性指的是正确碱基数占实际碱基数的百分比,而特异性是指在预测结果的所有碱基中正确预测的碱基所占百分比,马休兹相互作用系数MCC是通过比对天然结构与预测结构而计算出来的值,它兼顾了敏感性与特异性,最小值为-1,表示预测结构与天然结构碱基配对相似度为0;最大值为1,表示预测结构与天然结构相似度为1;其特征是:
对假结RNA二级结构进行预测,建立一个多目标最优化模型P:
(P)
其中:
Ω是以茎区Pair为变量的决策空间,
X是一个或则多个茎区组成的茎区集合Pairs,
i表示RNA序列第i个碱基的序列,
xi表示该碱基的配对号,在算法中被看作一个个体,
f1(X)用于评价RNA二级结构中茎区结构的数量,StemGroup为茎区数量,用来评价RNA二级结构配对碱基对的数量,即总的碱基配对数,
Qij(X)=M(class(xi),class(xj))+P(distance(xi,xj))+K是每个碱基对的匹配得分,其中Class()是类型运算符,输出该碱基类型;Distance()是距离运算符,输出这两个碱基的相对距离,K是常系数,M(class(xi),class(xj))是匹配类型得分,P(distance(xi,xj))是匹配距离得分;
用于刻画马休兹相互作用系数,具体衡量公式如下:
其中,TN表示正确预测的不配对的碱基的个数;TP表示预测结果中正确的碱基对个数,FP表示预测结果中不存在于实际结构中的碱基对数,FN表示没有预测出的碱基对个数。
2.根据权利要求1所述的基于模拟退火算法的假结RNA结构预测方法,其特征是:
所述多目标最优化模型P模型中,令则多目标最优化模型P可转化为:
(P1)
更改后的所述多目标最优化模型P更适合于数值计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛超蓝生物信息科技有限公司,未经青岛超蓝生物信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210812578.1/1.html,转载请声明来源钻瓜专利网。