[发明专利]一种蛋白质相互作用预测方法、装置及存储介质在审

专利信息
申请号: 202211678119.5 申请日: 2022-12-26
公开(公告)号: CN116259358A 公开(公告)日: 2023-06-13
发明(设计)人: 陈璟;曹汉童;任利军 申请(专利权)人: 江南大学
主分类号: G16B15/30 分类号: G16B15/30;G16B40/30;G06N3/045;G06N3/0464;G06N3/0499;G06N3/088
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 杨慧林
地址: 214122 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 蛋白质 相互作用 预测 方法 装置 存储 介质
【说明书】:

发明涉及生物学技术领域,尤其是指一种蛋白质相互作用预测方法、装置、设备及存储介质。本发明所述的蛋白质相互作用预测方法,通过调整Doc2vec非监督段落向量学习模型,将不定长的蛋白质序列特征信息嵌入至低维向量空间,能够处理任意长度的蛋白质序列,解决了蛋白质初步特征选取问题,利用图同构卷积网络的优势,充分结合蛋白质相互作用PPI网络结构的信息,聚合每个蛋白质的相邻蛋白质的信息,优化了蛋白质节点的编码表征,根据PPI网络结构信息,找到蛋白质相互作用边,结合两个蛋白质节点信息,并不断从中学习更高效且准确的分类预测,提高了模型预测的准确度。

技术领域

本发明涉及生物学技术领域,尤其是指一种蛋白质相互作用预测方法、装置、设备及存储介质。

背景技术

现有的技术中,蛋白质相互作用(PPI,Protein-protein interaction)是指蛋白质分子之间的相关性,并从生物化学、信号转导和遗传网络的角度研究这种相关性。近年来,随着高通量筛选技术的发展,通过实验方法检测到蛋白质相互作用的数量有了大幅度增加,形成了越来越多的蛋白质相互作用网络。对蛋白质相互作用网络的分析能够增进对生物学过程的理解,对网络中PPI的功能预测在细胞生物学有着重要意义,例如新药设计和靶点治疗。现有一些对PPI预测方法存在以下问题:

“Path2PPI:an R package to predict protein–protein interactionnetworks for a set of proteins”(期刊出处:Bioinformatics,2016,32:1427-1429)融合同源性的方法,通过计算蛋白质的BLAST值将一对序列映射到已知的相互作用蛋白质,从而推断出新的PPI。“Using support vector machine combined with auto covarianceto predict protein–protein interactions from protein sequences”(期刊出处:Nucleic acids research,2008,36(9):3025-3030)融合相邻效应,从而提出结合自协方差(AC)和支持向量机(SVM)的新特征表示。“Detection of protein-protein interactionsfrom amino acid sequences using a rotation forest model with a novel pr-lpqdescriptor”(期刊出处:In International Conference on Intelligent Computing,2015,10(8):713-720)采用物理化学特性响应矩阵(PR)将序列转化为矩阵,使用局部相位量化(LPQ)的纹理描述符提取局部短语信息矩阵,将随机森林(RF)模型与新特征表示相结合来检测PPI。“A method for predicting protein-protein interaction types”(期刊出处:PLoS One,2014,9(3):e90904)融合检测交互的实验技术,采用逻辑回归(LR)来预测交互类型。“Predicting protein–protein interactions based only on sequencesinformation”(期刊出处:Proceedings of the National Academy of Sciences,2007,104(11):4337-4341)融合支持向量机(SVM),结合描述氨基酸的联合三元组特征和序列信息来预测PPI。这些方法很大程度上依赖于提取和选择更好特征的能力,因此性能受到PPI特征表示和模型表达能力的限制。“Deep neural network based predictions ofprotein interactions using primary sequences”(期刊出处:Molecules,2018,23(8):1923-1935),“Predicting protein–protein interactions through sequence-baseddeep learning”(期刊出处:Bioinformatics,2018,34(17):i802-i810),“Multifacetedprotein–protein interaction prediction based on siamese residual rcnn”(期刊出处:Bioinformatics,2019,35(14):i305-i314)分别使用卷积神经网络(CNN)、循环神经网络(RNN)以及区域卷积神经网络(R-CNN)来提取序列中的高维信息特征,从而改进了PPI相关任务中的模型预测性能。Neural Network for Inter-novel-protein InteractionPrediction”(期刊出处:https://arxiv.org/abs/2105.06709,2021.)首次将图神经网络扩展到多标签PPI分类。相较于早期机器学习方法,以上模型有了一定的深度,非线性的建模能力得到了增强,对多类型PPI预测这类复杂的任务表现也不断提升,但忽视了PPI网络的结构信息,存在一定的局限性,准确性也有待提高。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211678119.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top