[发明专利]基于深度卷积神经网络的生物活性肽预测方法在审
| 申请号: | 202111465271.0 | 申请日: | 2021-12-03 |
| 公开(公告)号: | CN114334011A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 林常航 | 申请(专利权)人: | 福建技术师范学院 |
| 主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B45/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 蔡晓敏 |
| 地址: | 350300 福建*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 卷积 神经网络 生物 活性 预测 方法 | ||
本发明涉及一种基于深度卷积神经网络的生物活性肽预测方法,通过不同尺寸过滤器的一维卷积来处理原始的氨基酸残基序列,提取有用的特征,通过优化模型输出与标签的交叉熵损失优化模型,专门为AAP的挖掘和预测而设计,该模型即AAPred‑CNN基于嵌入技术而不基于特征工程和人工设计的特征,AAPred‑CNN的训练和测试所使用的数据集是公开的数据集main和NT15数据集,本发明通过将首次将经典的深度学习算法TextCNN结合嵌入技术、残基倾向性分析等应用到抗血管生成肽的预测问题上,为AAP的挖掘和预测设计出具备优秀性能分类器AAPred‑CNN,AAPred‑CNN基于嵌入技术,不依赖于特征工程,能够通过自适应地方式从纯粹的氨基酸残基序列中提取有用的信息并用于预测多肽是否具有抗血管生成的功能活性。
技术领域
本发明属于生物信息技术领域,首次结合残基倾向性分析将经典的深度学习算法TextCNN应用到抗血管生成肽(AAP,anti-angiogenic peptide)的预测问题上,为AAP的挖掘和预测设计出具备优秀性能的分类器AAPred-CNN。AAPred-CNN基于嵌入技术,不依赖于特征工程,能够通过自适应地方式从纯粹的氨基酸残基序列中提取有用的信息,并用于预测多肽是否具有抗血管生成的功能活性,尤其涉及基于深度卷积神经网络的生物活性肽预测方法。
背景技术
随着后基因组数据的快速增长,肽序列广泛存在于各种数据库中,促进了治疗性肽的研究。例如,抗血管生成肽(AAP)已被证明对癌症、失明、类风湿性关节炎和银屑病等疾病的治疗有效。众所周知,单克隆抗血管内皮生长因子抗体(anti-VEGF antibody,Avastin或Bevacizumab)是第一种能够抑制肿瘤血管生长并提高癌症患者生存率的抗血管生成药物。肽的显著特性,如显著的效力、高选择性和低毒性,吸引了许多研究人员开发新型靶向药物。然而,全球市场上现有的肽类药物只有不到一百种,因为用于识别和开发肽类药物的传统实验技术非常缓慢,包括AAP。因此,基于计算模型识别潜在AAP是非常可取的,因为它们具有节省时间和金钱的优势。
但是,迄今为止,很少有人致力于开发准确预测AAP的方法。所有现有的计算方法都基于传统的机器学习,如SVM(支持向量机)和RF(随机森林)。2015年,Ramaprasad等人提出了Anti Angiopred,这是第一个基于SVM和特征工程的AAP识别计算模型,准确率约为75%。最近,Blanco等人在2018年基于三个基本序列描述符氨基酸(AAC)、二肽(DC)和三肽成分(TC)开发了一个广义线性模型,并获得了性能改进。之后,Zahiri等人在2019年选择了2000多个信息特征并评估了227个机器学习模型,建立了一个名为AntAngioCOOL的R软件包。他们还揭示了DC在k-聚体组成特征中对抗血管生成肽预测的贡献最大。最近,Laengsri等人利用随机森林和不同类别的肽特征构建了目前最先进的分类器TargetAntiAngio,在独立验证测试中获得了约77%的最高准确率。
发明内容
我们可以看到,现有的方法都是基于传统的机器学习模型,并且受到特征工程的影响,这需要研究人员的先验知识来设计合适的描述符来训练一个好的模型。这些缺点是限制AAP预测性能进一步提高的重要原因。此外,最近在相关治疗性肽预测任务中出现了一些最先进的预测因子,如ACP(抗癌肽)的ACPred-LAF、AFP(抗真菌肽)的Deep-AntiFP、BP(苦味肽)的BERT4Bitter已经证明,基于深度学习的模型优于现有的传统机器学习方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建技术师范学院,未经福建技术师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111465271.0/2.html,转载请声明来源钻瓜专利网。





