[发明专利]基于低精度RBF核的支持向量机的ncRNA识别方法、系统及设备在审
申请号: | 202210264629.1 | 申请日: | 2022-03-17 |
公开(公告)号: | CN114821577A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 李长石 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/69 | 分类号: | G06V20/69;G16B30/00;G06N20/10 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 精度 rbf 支持 向量 ncrna 识别 方法 系统 设备 | ||
本发明公开了一种基于低精度RBF核的支持向量机的ncRNA识别方法、系统及设备,包括数据处理,模型训练和模型预测三步骤。第一步,将RNA数据处理成模型所需的标准格式,第二步,选择精度模式,将RNA数据输入模型进行训练,第三步,训练完成的模型对待识别的RNA数据进行预测。实验结果显示,上述方法在较为准确地识别ncRNA的情况下,提升了基于RBF核的支持向量机模型的训练以及预测的计算效率。
技术领域
本发明属于非编码RNA识别技术领域,涉及一种ncRNA识别方法、系统及设备,特别涉及一种基于低精度RBF核的支持向量机模型的ncRNA识别方法、系统及设备。
背景技术
ncRNA(非编码RNA)是具有功能而不被翻译成蛋白质的RNA分子。ncRNAs在细胞生命活动和疾病发病机制中起到重要作用,随着高通量技术的应用,ncRNA的数量正在快速增长,为了更好地理解生物学和发现候选药物靶点,准确快速地识别ncRNA具有重要的现实意义和应用价值。
支持向量机是一种具有坚实理论基础的分类方法,利用内积核函数代替高维非线性映射,其中最常用的核函数为RBF核。RBF核在ncRNA的识别中存在良好的表现,但是RBF核中的指数函数运算代价往往太大,且在基于RBF核的支持向量机模型的训练以及预测过程中的耗时占比较大,导致模型的训练与预测效率低下,不利于技术的推广。
发明内容
鉴于上述问题,本发明提供了一种基于低精度RBF核的支持向量机模型的ncRNA识别方法、系统及设备,用来快速准确地识别出ncRNA,促进技术的推广使用。
本发明的方法所采用的技术方案是:一种基于低精度RBF核的支持向量机的ncRNA识别方法,包括以下步骤:
步骤1:将待识别的RNA数据进行预处理;
步骤2:针对预处理后的RNA数据,提取出数据特征;
步骤3:将提取的数据特征信息输入低精度RBF核的支持向量机中进行ncRNA识别;
所述低精度RBF核,为k(x1,x2)=exp(-γ(||x1-x2||)2);其中γ为核函数系数,x1与x2为任意两个RNA的特征组成的向量。
本发明的系统所采用的技术方案是:一种基于低精度RBF核的支持向量机的ncRNA识别系统,包括以下模块:
模块1,用于将待识别的RNA数据进行预处理;
模块2,用于针对预处理后的RNA数据,提取出数据特征;
模块3,用于将提取的数据特征信息输入低精度RBF核的支持向量机中进行ncRNA识别;
所述低精度RBF核,为k(x1,x2)=exp(-γ(||x1-x2||)2);其中γ为核函数系数,x1与x2为任意两个RNA的特征组成的向量。
本发明的设备所采用的技术方案是:一种基于低精度RBF核的支持向量机的ncRNA识别设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的低精度RBF核的支持向量机的ncRNA识别方法。
本发明利用RNA的八个数据特征与支持向量机模型可以较为准确地识别ncRNA,利用低精度RBF核函数提升了模型训练与预测的计算效率。同时降低了基于RBF核的支持向量机模型在训练以及预测ncRNA过程中的计算耗时。
附图说明
图1为本发明实施例的方法流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210264629.1/2.html,转载请声明来源钻瓜专利网。