[发明专利]DNA6mA修饰类别的预测方法、装置、设备和存储介质有效
申请号: | 202110606033.0 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113409891B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 邹权;张昊宇 | 申请(专利权)人: | 电子科技大学长三角研究院(衢州) |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G06F18/2411 |
代理公司: | 成都创新引擎知识产权代理有限公司 51249 | 代理人: | 向群 |
地址: | 324003 浙江省衢*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | dna6ma 修饰 类别 预测 方法 装置 设备 存储 介质 | ||
本申请提供了一种DNA6mA修饰类别的预测方法、装置、设备和存储介质。方法包括:获取DNA6mA特征数据集;确定所述DNA6mA特征数据集中各个序列间的相似度矩阵;对所述相似度矩阵进行对数化处理,获得所述各个序列间的第一矩阵距离矩阵;对所述距离矩阵进行高斯化处理,获得满足正定性要求的距离矩阵;将所述满足正定性要求的距离矩阵作为支持向量机的自定义核矩阵,并基于支持向量机模型,对待预测序列的DNA6mA修饰类别进行预测。能够预测序列的DNA6mA修饰类别。
技术领域
本申请涉及生物信息学技术领域,特别是涉及一种DNA6mA修饰类别的预测方法、装置、设备和存储介质。
背景技术
人类最早发现的表观遗传调控机制之一就是DNA甲基化。哺乳动物中最主要的DNA修饰是5mC(5-甲基胞嘧啶),占人类DNA中总胞嘧啶的3%-6%。相反,5mC在原核生物中很少,而6mA(N6-甲基腺嘌呤)则是原核生物中最具代表性的DNA修饰,主要参与限制-修饰系统,保护个体免受外来DNA的侵入。1951年6mA修饰首次在细菌中被发现。然而,它不像5mC那样受到重视。一个重要的原因是6mA的修饰被认为只在原核生物和单细胞真核生物中广泛存在,但在多细胞真核生物中很少发现。但近年来实验性方法在真核生物,甚至包括哺乳动物和植物基因组中鉴定到了6mA,并发现6mA在生长发育和疾病调控中具有重要作用。这些研究掀开了真核生物表观遗传修饰的新篇章。但是随着数据量的不断的增大和对准确率的更高的要求,实验性方法高耗时和高成本的缺点就暴露出来了,于是一些计算性方法就涌现了出来。基于机器学习的预测工具不断被开发出来,包括iDNA6mA-PseKNC,i6mA-Pred等,但是很少有研究以序列间的距离作为分类预测的主要依据。因此,有必要研究如何利用序列距离对DNA6mA进行分类。
发明内容
本申请提供一种DNA6mA修饰类别的预测方法、装置、设备和存储介质,能够预测序列的DNA6mA修饰类别。
本申请实施例第一方面提供了一种DNA6mA修饰类别的的预测方法,包括:
获取DNA6mA特征数据集;
确定所述DNA6mA特征数据集中各个序列间的相似度矩阵;
对所述相似度矩阵进行对数化处理,获得所述各个序列间的距离矩阵;
对所述距离矩阵进行高斯化处理,获得满足正定性要求的距离矩阵;
将所述满足正定性要求的距离矩阵作为支持向量机的自定义核矩阵,并基于支持向量机模型,对DNA6mA修饰类别进行预测。
可选地,确定所述DNA6mA特征数据集中各个序列间的相似度矩阵,包括:
基于后缀树的双序列比对模型得到所述DNA6mA特征数据集中各个序列间的相似度矩阵。
可选地,基于后缀树的双序列比对模型得到所述DNA6mA特征数据集中各个序列间的相似度矩阵,包括:
将第一输入序列构造为第一后缀树;
获取与所述第一输入序列进行比对的第二输入序列;
基于所述第一后缀树和所述第二输入序列,采用LCS模型确定所述第一输入序列和所述第二输入序列的公共子串;
基于预设合格标准,从所述公共子串中剔除不合格子串;
采用Needleman-Wunsch模型将所述第一输入序列和第二输入序列中未匹配的子串进行比对,并基于比对结果形成比对结果序列;
基于所述公共子串的长度和所述比对结果序列长度,确定所述第一输入序列和所述第二输入序列之间的相似度。
可选地,所述DNA6mA特征数据集包括正例数据集和反例数据集,所述正例数据集为DNA6mA序列,所述反例数据集为非DNA6mA序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(衢州),未经电子科技大学长三角研究院(衢州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110606033.0/2.html,转载请声明来源钻瓜专利网。