[发明专利]基于低精度RBF核的支持向量机的ncRNA识别方法、系统及设备在审
申请号: | 202210264629.1 | 申请日: | 2022-03-17 |
公开(公告)号: | CN114821577A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 李长石 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/69 | 分类号: | G06V20/69;G16B30/00;G06N20/10 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 精度 rbf 支持 向量 ncrna 识别 方法 系统 设备 | ||
1.一种基于低精度RBF核的支持向量机的ncRNA识别方法,其特征在于,包括以下步骤:
步骤1:将待识别的RNA数据进行预处理;
步骤2:针对预处理后的RNA数据,提取出数据特征;
步骤3:将提取的数据特征信息输入低精度RBF核的支持向量机中进行ncRNA识别;
所述低精度RBF核,为k(x1,x2)=exp(-γ(||x1-x2||)2);其中γ为核函数系数,x1与x2为任意两个RNA的特征组成的向量。
2.根据权利要求1所述的基于低精度RBF核的支持向量机的ncRNA识别方法,其特征在于:步骤1中所述预处理,是将每条RNA数据处理成fasta格式数据。
3.根据权利要求1所述的基于低精度RBF核的支持向量机的ncRNA识别方法,其特征在于:步骤2中所述数据特征包括八个特征,第一个特征为Dynalign算法计算得到的双链RNA的ΔG°total=ΔG°1+ΔG°2+间隙数量×ΔG°gp;其中ΔG°1与ΔG°2分别为双链RNA的两个序列的二级结构的预测折叠自由能变化,ΔG°gp是对间隙施加的惩罚;第二个特征为双链RNA的两个序列中较短序列的长度;第三个特征为某一个序列中碱基‘A’出现的频率;第四个特征为某一个序列中碱基‘U’出现的频率;第五个特征为某一个序列中碱基‘C’出现的频率;第六个特征为另一个序列中碱基‘A’出现的频率;第七个特征为另一个序列中碱基‘U’出现的频率;第八个特征为另一个序列中碱基‘C’出现的频率。
4.根据权利要求1-3任意一项所述的基于低精度RBF核的支持向量机的ncRNA识别方法,其特征在于:所述低精度RBF核的支持向量机,是训练好的低精度RBF核的支持向量机;
所述低精度RBF核的支持向量机训练过程包括以下子步骤:
(1)构建训练集,提取训练集中RNA数据的八个特征与标签;
所述八个特征,第一个特征为Dynalign算法计算得到的双链RNA的ΔG°total=ΔG°1+ΔG°2+间隙数量×ΔG°gp;其中ΔG°1与ΔG°2分别为两个序列的二级结构的预测折叠自由能变化,ΔG°gp是对间隙施加的惩罚;第二个特征为两个序列中较短序列的长度;第三个特征为某一个序列中碱基‘A’出现的频率;第四个特征为某一个序列中碱基‘U’出现的频率;第五个特征为某一个序列中碱基‘C’出现的频率;第六个特征为另一个序列中碱基‘A’出现的频率;第七个特征为另一个序列中碱基‘U’出现的频率;第八个特征为另一个序列中碱基‘C’出现的频率;
所述标签,ncRNA数据的标签为1,非ncRNA数据的标签为-1;
(2)设置停机条件tol,并将训练集中数据输入低精度RBF核的支持向量机中进行训练;
所述低精度RBF核的支持向量机,包括五种近似模式的RBF核的支持向量机,分别为一阶近似模式,二阶近似模式,三阶近似模式,四阶近似模式和五阶近似模式;
一阶近似模式使用了一阶泰勒展开:exp(k)=1+k;其中k表示将RBF核函数exp(-γ(||x1-x2||)2)缩放2r后使得k∈(0,1)的变量,满足等式2r×exp(k)=exp(-γ(||x1-x2||)2),γ为RBF核函数系数,x1与x2为任意两个RNA的特征组成的向量,r为指数位;
二阶近似模式使用了二阶泰勒展开:exp(k)=1+k+k2/2!;
三阶近似模式使用了三阶泰勒展开:exp(k)=1+k+k2/2+k3/3!;
四阶近似模式使用了四阶泰勒展开:exp(k)=1+k+k2/2+k3/3!+k4/4!;
五阶近似模式使用了五阶泰勒展开:exp(k)=1+k+k2/2+k3/3!+k4/4!+k5/5!;
(3)当计算误差小于停机条件tol时结束计算,获得训练好的低精度RBF核的支持向量机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210264629.1/1.html,转载请声明来源钻瓜专利网。