[发明专利]S-亚硝基化位点预测方法、模型训练方法及存储介质在审
| 申请号: | 202111136267.X | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN113838524A | 公开(公告)日: | 2021-12-24 |
| 发明(设计)人: | 邹权;马家奇;韩轲 | 申请(专利权)人: | 电子科技大学长三角研究院(衢州) |
| 主分类号: | G16B20/30 | 分类号: | G16B20/30;G06Q10/04;G06N3/04;G06K9/62 |
| 代理公司: | 成都创新引擎知识产权代理有限公司 51249 | 代理人: | 林庆华 |
| 地址: | 324003 浙江省衢*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 硝基 化位点 预测 方法 模型 训练 存储 介质 | ||
1.一种S-亚硝基化位点预测模型的训练方法,其特征在于,包括以下步骤:
SS1获取S-亚硝基化序列数据文件,对数据文件进行预处理,得到序列样本;
SS2根据特征提取算法对所述序列样本进行特征提取,得到序列特征,并将序列特征拼接,得到初始特征集;
SS3对所述初始特征集进行平衡处理,并根据重要性对所述序列特征进行筛选,得到目标特征集;
SS4根据目标特征集对集成分类算法进行训练,得到目标S-亚硝基化位点预测模型。
2.根据权利要求1所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS1,包括以下步骤:
SS11获取S-亚硝基化序列数据文件;
SS12对数据文件进行预处理:在S-亚硝基化序列数据文件中,将S-亚硝基化序列文件作为序列正样本,将非S-亚硝基化序列文件作为序列负样本;
SS13得到序列样本:根据所述序列正样本和所述序列负样本,得到序列样本。
3.根据权利要求2所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS1中,对数据文件进行预处理,包括以下步骤:
SS121对S-亚硝基化序列数据文件进行格式修正、内容修正、冗余度修正;
SS122再将其中S-亚硝基化序列文件作为序列正样本,将非S-亚硝基化序列文件作为序列负样本。
4.根据权利要求1所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS2中,所述特征提取算法包括:
bidirectional long short term memory算法和bidirectional encoderrepresentations from Transformers算法。
5.根据权利要求1~4任一项所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS2,包括以下步骤:
SS21根据序列样本中同一序列位置顺序,对所述序列样本进行特征提取,得到与序列样本位置顺序相应一致的序列特征;
SS22根据序列样本中同一序列位置顺序对序列特征进行拼接,得到与序列样本位置顺序相应一致的初始特征集。
6.根据权利要求1所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS3,包括以下步骤:
根据edited nearest neighbours(ENN)和adaptive synthetic(ADASYN)算法对所述初始特征集进行平衡处理,并根据MRMD算法对所述序列特征进行筛选,得到目标特征集。
7.据权利要求6所述的S-亚硝基化位点预测模型的训练方法,其特征在于,所述MRMD算法依据maxMRi、mean(maxMDi)以及MRMDscore对所述序列特征进行筛选,公式如下:
其中,其中maxMRi表示i个特征之间的最大关联MR(Max-Relevance)值;MDi表示i个特征之间的最大距离;MRMDscore为最大关联-最大距离(MR-MD)的最终得分;
PCC表示皮尔逊相关系数(Pearsons correlation coefficient),是M-D维的特征向量,由每个实例的第i个特征组成;也是一个M-D维的特征向量,它的每个元素都来自每个实例的目标类C;
EDi表示第i个特征的欧几里得距离(Euclidean distance)、COSi表示第i个特征的余弦相似度(cosine similarity),而TCi则表示第i个特征的谷本系数(Tanimotocoefficient),mean(maxMDi)表示最大距离的均值;
变量wr(0wr≤1)和wd((0wd≤1)分别为最大相关度MR和最大距离MD的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(衢州),未经电子科技大学长三角研究院(衢州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111136267.X/1.html,转载请声明来源钻瓜专利网。





