[发明专利]基于深层图卷积网络的蛋白质-蛋白质相互作用位点预测方法有效
申请号: | 202110502536.3 | 申请日: | 2021-05-08 |
公开(公告)号: | CN113192559B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 杨跃东;袁乾沐;卢宇彤 | 申请(专利权)人: | 中山大学 |
主分类号: | G16B25/00 | 分类号: | G16B25/00;G06N3/0464;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深层 图卷 网络 蛋白质 相互作用 预测 方法 | ||
本发明公开了一种基于深层图卷积网络的蛋白质‑蛋白质相互作用位点预测方法,包括步骤如下:根据蛋白质的序列和结构信息,提取节点特征矩阵和包含边信息的邻接矩阵,共同构成蛋白图表征;采用基于初始残差和恒等映射的深层图卷积;深层图卷积的最后一层图卷积层的输出输入一个多层感知机,完成构建深层图卷积神经网络;将训练数据提取得到蛋白图表征,采用五折交叉验证方法对深层图卷积神经网络进行训练;将待测数据通过提取得到蛋白图表征,并输入训练好的深层图卷积神经网络,实现对蛋白‑蛋白相互作用位点的预测。本发明能更充分地利用蛋白质空间结构信息,进一步提高蛋白‑蛋白相互作用位点预测的准确率。
技术领域
本发明涉及生物信息技术领域,更具体的,涉及一种基于深层图卷积网络的蛋白质-蛋白质相互作用位点预测方法。
背景技术
蛋白-蛋白相互作用(PPI)在信号传导、物质运输和新陈代谢等生理活动中扮演重要角色。识别蛋白-蛋白复合物之间参与物理接触的氨基酸(即蛋白-蛋白相互作用位点)有助于构建蛋白-蛋白相互作用网络、预测蛋白功能、揭示疾病机理和新药研发。然而,用双杂交试验和亲和力纯化等传统实验方法来识别PPI位点成本高且耗时长。因此,研发能准确预测PPI位点的计算方法有很大的实际意义。
目前预测PPI位点的计算方法可根据方法所需的信息分为两大类:
第一类是基于蛋白序列的方法,此类方法只需蛋白质的氨基酸序列信息即可做出预测,但它们的预测准确率通常非常有限;二类是基于蛋白结构的方法,此类方法需要蛋白质中氨基酸的三维原子坐标信息来预测PPI位点,而它们的预测准确率通常更高,且由于目前结构已知但功能未知的蛋白质越来越多,基于结构的预测方法有很大实际意义。
大多数现有的PPI位点预测方法基于机器学习技术,其中蛋白质会被编码成特征矩阵。常用的蛋白特征包括独热(one-hot)编码、进化保守性信息、二级结构、相对溶解性(RSA)和氨基酸物理化学性质等。提取蛋白质特征后,各种各样的机器学习技术可被应用于PPI位点预测,如最近的基于序列的方法DELPHI使用了包含卷积神经网络和循环神经网络的集成框架;基于结构的方法DeepPPISP使用卷积神经网络提取蛋白质全局信息。
然而,这些方法都只将蛋白质视作一维序列,从而去学习序列上相近的氨基酸的相互关系。由于蛋白质是一个折叠的三维结构,这些方法忽略了在序列上相距很远,但在三维空间上相距很近的氨基酸带来的影响。另一方面,基于结构的方法SPPIDER考虑到了这点,并利用带权平均的方法整合空间上相距以内的氨基酸的特征。然而,这种选择邻居的方式基于一个较随意的距离阈值,且不能提取到空间上相距较远的氨基酸信息,而线性的平均也不能有效模拟空间相邻的氨基酸之间的复杂关系。
发明内容
现有的PPI位点预测方法大多数只提取序列上相邻的氨基酸信息,又或者是过于简单地整合空间结构信息,为了解决现有方法的以上存在的不足,本发明提出了一种基于深层图卷积网络的蛋白质-蛋白质相互作用位点预测方法,其能更充分地利用蛋白质空间结构信息,进一步提高蛋白-蛋白相互作用位点预测的准确率。
为实现上述本发明目的,采用的技术方案如下:
一种基于深层图卷积网络的蛋白质-蛋白质相互作用位点预测方法,所述的方法包括步骤如下:
S1:根据蛋白质的序列和结构信息,提取节点特征矩阵和包含边信息的邻接矩阵,共同构成蛋白图表征;
S2:采用基于初始残差和恒等映射的深层图卷积,以捕获高阶空间邻近氨基酸的特征;并在深层图卷积的最后一层图卷积层的输出输入一个多层感知机,实现最终预测每一个氨基酸的蛋白相互作用概率,完成构建深层图卷积神经网络;
S3:将训练数据通过步骤S1提取得到蛋白图表征,采用五折交叉验证方法对步骤S2得到的深层图卷积神经网络进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110502536.3/2.html,转载请声明来源钻瓜专利网。