[发明专利]基于双向长短期记忆网络与特征融合的抗癌肽预测方法在审
申请号: | 202210686266.0 | 申请日: | 2022-06-17 |
公开(公告)号: | CN114863997A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 杨森;叶晨阳;朱轮;封红旗 | 申请(专利权)人: | 常州大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B40/00;G06N3/04;G06N3/08 |
代理公司: | 常州市英诺创信专利代理事务所(普通合伙) 32258 | 代理人: | 张秋月 |
地址: | 213164 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 短期 记忆 网络 特征 融合 抗癌 预测 方法 | ||
1.基于双向长短期记忆网络与特征融合的抗癌肽预测方法,其特征在于,包括以下步骤:
步骤1、读取四个基准肽序列数据集,对数据集进行氨基酸组成分析;
步骤2、通过Bi-LSTM对数据集进行特征提取,生成Bi-LSTM特征向量;
步骤3、通过全连接神经网络对五个氨基酸特征向量进行特征提取;
步骤4、将步骤2与步骤3产生的特征向量通过Concatenate算法进行特征融合,特征向量输入一个具有512单元和relu激活函数的全连接层,通过一个具有1单元和Sigmoid激活函数的全连接层,得到概率分数,通过分数区分为抗癌肽和非抗癌肽。
2.根据权利要求1所述的基于双向长短期记忆网络与特征融合的抗癌肽预测方法,其特征在于,所述步骤2包括:
步骤2.1、按照氨基酸字母表对肽的初级字母序列进行数字编码;
步骤2.2、通过Bi-LSTM的嵌入层将输入的数字编码转化为64维向量;
步骤2.3、Bi-LSTM对输入64维向量进行特征提取,Bi-LSTM包括:t时刻的输入xt,细胞状态Ct,临时细胞状态隐层状态ht,遗忘门ft,记忆门it,输出门Ot;Bi-LSTM由前向和后向长短期记忆网络层组成,每层由一个记忆单元和64维隐藏单元组成。
3.根据权利要求1所述的基于双向长短期记忆网络与特征融合的抗癌肽预测方法,其特征在于,所述步骤3包括:根据五个氨基酸特征对肽的初级字母序列进行特征编码,特征编码将肽序列转换成770维的特征向量,五个氨基酸特征包括BPF、DPC、CKSAAGP、AAC和SOCNumber。
4.根据权利要求3所述的基于双向长短期记忆网络与特征融合的抗癌肽预测方法,其特征在于,五个氨基酸特征对肽的初级字母序列进行特征编码包括:
BPF特征编码表示为:
B(P)=[f(p1),f(p2),...,f(pn)] (7)
其中,P为肽序列、f(pn)表示某个氨基酸字母;
DPC特征编码表示为:
其中,Nab是由氨基酸类型a和b表示的二肽的数量;
CKSAAGP特征编码表示为:
其中,Ng1g1-Ng5g5为25个零间隔的组对;
AAC特征编码表示为:
其中,N(a)表示氨基酸出现在肽序列的次数,N表示肽序列的长度;
SOCNumber特征编码表示为:
其中,di,i+d描述了两个氨基酸在位置i和i+d之间的距离,nlag表示滞后的最大值,N是肽序列的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210686266.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光伏系统及其优化器组网方法
- 下一篇:一种测量设备整体同轴度的方法