[发明专利]S-亚硝基化位点预测方法、模型训练方法及存储介质在审

专利信息
申请号: 202111136267.X 申请日: 2021-09-27
公开(公告)号: CN113838524A 公开(公告)日: 2021-12-24
发明(设计)人: 邹权;马家奇;韩轲 申请(专利权)人: 电子科技大学长三角研究院(衢州)
主分类号: G16B20/30 分类号: G16B20/30;G06Q10/04;G06N3/04;G06K9/62
代理公司: 成都创新引擎知识产权代理有限公司 51249 代理人: 林庆华
地址: 324003 浙江省衢*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 硝基 化位点 预测 方法 模型 训练 存储 介质
【权利要求书】:

1.一种S-亚硝基化位点预测模型的训练方法,其特征在于,包括以下步骤:

SS1获取S-亚硝基化序列数据文件,对数据文件进行预处理,得到序列样本;

SS2根据特征提取算法对所述序列样本进行特征提取,得到序列特征,并将序列特征拼接,得到初始特征集;

SS3对所述初始特征集进行平衡处理,并根据重要性对所述序列特征进行筛选,得到目标特征集;

SS4根据目标特征集对集成分类算法进行训练,得到目标S-亚硝基化位点预测模型。

2.根据权利要求1所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS1,包括以下步骤:

SS11获取S-亚硝基化序列数据文件;

SS12对数据文件进行预处理:在S-亚硝基化序列数据文件中,将S-亚硝基化序列文件作为序列正样本,将非S-亚硝基化序列文件作为序列负样本;

SS13得到序列样本:根据所述序列正样本和所述序列负样本,得到序列样本。

3.根据权利要求2所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS1中,对数据文件进行预处理,包括以下步骤:

SS121对S-亚硝基化序列数据文件进行格式修正、内容修正、冗余度修正;

SS122再将其中S-亚硝基化序列文件作为序列正样本,将非S-亚硝基化序列文件作为序列负样本。

4.根据权利要求1所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS2中,所述特征提取算法包括:

bidirectional long short term memory算法和bidirectional encoderrepresentations from Transformers算法。

5.根据权利要求1~4任一项所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS2,包括以下步骤:

SS21根据序列样本中同一序列位置顺序,对所述序列样本进行特征提取,得到与序列样本位置顺序相应一致的序列特征;

SS22根据序列样本中同一序列位置顺序对序列特征进行拼接,得到与序列样本位置顺序相应一致的初始特征集。

6.根据权利要求1所述的S-亚硝基化位点预测模型的训练方法,其特征在于,步骤SS3,包括以下步骤:

根据edited nearest neighbours(ENN)和adaptive synthetic(ADASYN)算法对所述初始特征集进行平衡处理,并根据MRMD算法对所述序列特征进行筛选,得到目标特征集。

7.据权利要求6所述的S-亚硝基化位点预测模型的训练方法,其特征在于,所述MRMD算法依据maxMRi、mean(maxMDi)以及MRMDscore对所述序列特征进行筛选,公式如下:

其中,其中maxMRi表示i个特征之间的最大关联MR(Max-Relevance)值;MDi表示i个特征之间的最大距离;MRMDscore为最大关联-最大距离(MR-MD)的最终得分;

PCC表示皮尔逊相关系数(Pearsons correlation coefficient),是M-D维的特征向量,由每个实例的第i个特征组成;也是一个M-D维的特征向量,它的每个元素都来自每个实例的目标类C;

EDi表示第i个特征的欧几里得距离(Euclidean distance)、COSi表示第i个特征的余弦相似度(cosine similarity),而TCi则表示第i个特征的谷本系数(Tanimotocoefficient),mean(maxMDi)表示最大距离的均值;

变量wr(0wr≤1)和wd((0wd≤1)分别为最大相关度MR和最大距离MD的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(衢州),未经电子科技大学长三角研究院(衢州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111136267.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top