[发明专利]一种蛋白质相互作用预测方法、装置及存储介质在审
| 申请号: | 202211678119.5 | 申请日: | 2022-12-26 |
| 公开(公告)号: | CN116259358A | 公开(公告)日: | 2023-06-13 |
| 发明(设计)人: | 陈璟;曹汉童;任利军 | 申请(专利权)人: | 江南大学 |
| 主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B40/30;G06N3/045;G06N3/0464;G06N3/0499;G06N3/088 |
| 代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 杨慧林 |
| 地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 蛋白质 相互作用 预测 方法 装置 存储 介质 | ||
本发明涉及生物学技术领域,尤其是指一种蛋白质相互作用预测方法、装置、设备及存储介质。本发明所述的蛋白质相互作用预测方法,通过调整Doc2vec非监督段落向量学习模型,将不定长的蛋白质序列特征信息嵌入至低维向量空间,能够处理任意长度的蛋白质序列,解决了蛋白质初步特征选取问题,利用图同构卷积网络的优势,充分结合蛋白质相互作用PPI网络结构的信息,聚合每个蛋白质的相邻蛋白质的信息,优化了蛋白质节点的编码表征,根据PPI网络结构信息,找到蛋白质相互作用边,结合两个蛋白质节点信息,并不断从中学习更高效且准确的分类预测,提高了模型预测的准确度。
技术领域
本发明涉及生物学技术领域,尤其是指一种蛋白质相互作用预测方法、装置、设备及存储介质。
背景技术
现有的技术中,蛋白质相互作用(PPI,Protein-protein interaction)是指蛋白质分子之间的相关性,并从生物化学、信号转导和遗传网络的角度研究这种相关性。近年来,随着高通量筛选技术的发展,通过实验方法检测到蛋白质相互作用的数量有了大幅度增加,形成了越来越多的蛋白质相互作用网络。对蛋白质相互作用网络的分析能够增进对生物学过程的理解,对网络中PPI的功能预测在细胞生物学有着重要意义,例如新药设计和靶点治疗。现有一些对PPI预测方法存在以下问题:
“Path2PPI:an R package to predict protein–protein interactionnetworks for a set of proteins”(期刊出处:Bioinformatics,2016,32:1427-1429)融合同源性的方法,通过计算蛋白质的BLAST值将一对序列映射到已知的相互作用蛋白质,从而推断出新的PPI。“Using support vector machine combined with auto covarianceto predict protein–protein interactions from protein sequences”(期刊出处:Nucleic acids research,2008,36(9):3025-3030)融合相邻效应,从而提出结合自协方差(AC)和支持向量机(SVM)的新特征表示。“Detection of protein-protein interactionsfrom amino acid sequences using a rotation forest model with a novel pr-lpqdescriptor”(期刊出处:In International Conference on Intelligent Computing,2015,10(8):713-720)采用物理化学特性响应矩阵(PR)将序列转化为矩阵,使用局部相位量化(LPQ)的纹理描述符提取局部短语信息矩阵,将随机森林(RF)模型与新特征表示相结合来检测PPI。“A method for predicting protein-protein interaction types”(期刊出处:PLoS One,2014,9(3):e90904)融合检测交互的实验技术,采用逻辑回归(LR)来预测交互类型。“Predicting protein–protein interactions based only on sequencesinformation”(期刊出处:Proceedings of the National Academy of Sciences,2007,104(11):4337-4341)融合支持向量机(SVM),结合描述氨基酸的联合三元组特征和序列信息来预测PPI。这些方法很大程度上依赖于提取和选择更好特征的能力,因此性能受到PPI特征表示和模型表达能力的限制。“Deep neural network based predictions ofprotein interactions using primary sequences”(期刊出处:Molecules,2018,23(8):1923-1935),“Predicting protein–protein interactions through sequence-baseddeep learning”(期刊出处:Bioinformatics,2018,34(17):i802-i810),“Multifacetedprotein–protein interaction prediction based on siamese residual rcnn”(期刊出处:Bioinformatics,2019,35(14):i305-i314)分别使用卷积神经网络(CNN)、循环神经网络(RNN)以及区域卷积神经网络(R-CNN)来提取序列中的高维信息特征,从而改进了PPI相关任务中的模型预测性能。Neural Network for Inter-novel-protein InteractionPrediction”(期刊出处:https://arxiv.org/abs/2105.06709,2021.)首次将图神经网络扩展到多标签PPI分类。相较于早期机器学习方法,以上模型有了一定的深度,非线性的建模能力得到了增强,对多类型PPI预测这类复杂的任务表现也不断提升,但忽视了PPI网络的结构信息,存在一定的局限性,准确性也有待提高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211678119.5/2.html,转载请声明来源钻瓜专利网。





