[发明专利]一种基于流模型的抗体序列结构协同设计方法在审
申请号: | 202210001847.6 | 申请日: | 2022-01-04 |
公开(公告)号: | CN114360636A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 邓岳;郭弢 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B30/10;G16B40/00;G16B50/00 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 抗体 序列 结构 协同 设计 方法 | ||
本发明公开了一种基于流模型的抗体序列结构协同设计方法,包括以下步骤:S1、选取结构抗体数据集作为通用的抗体数据;S2、获取氨基酸序列信息及结构信息;S3、将序列信息及结构信息编码入图神经网络,对神经网络进行更新,得到氨基酸编码;S4、将氨基酸编码输入至第一流模型中进行变换,得到氨基酸类型,将预测到的氨基酸类型输入图神经网络,对其进行更新,得到新的氨基酸编码;S5、将新的氨基酸编码输入至第二流模型中进行变换,得到氨基酸的三维坐标信息;S6、将氨基酸类型及三维坐标信息与真实值做损失函数,最小化损失函数,优化生成模型参数。
技术领域
本发明涉及抗体序列结构预测技术领域,更具体的说是涉及一种基于流模型的抗体序列结构协同设计方法。
背景技术
目前,传统的机器学习方法是针对一个特定的,一般是有大量数据的数据集,试图学习出一个预测式模型或生成式模型,使得模型能够建模出数据集中的概率分布,从而得到准确的预测或是生成出符合数据集特征的样本。一种常用于生成式模型的方法,通过可逆、可微、连续的非线性变换,将具有复杂分布的数据集样本映射到具有简单分布的隐空间中,从而使得模型更好地对数据集中的概率分布进行建模。可变区是抗体结合抗原的位置,其氨基酸的组成和排列决定抗体的抗原结合特异性。可变区存在一些氨基酸能够高频变化组合的区域,这些区域被称为互补决定区(complementarity determining region,CDR区),CDR区决定了抗体的独特型(抗独特型抗体表达)。抗体设计就主要针对CDR区的氨基酸序列。进行设计。
但是,已有的机器学习多集中于预测式模型的研究上,对生成式模型的研究相对不足。在实际问题中,往往需要利用机器学习去生成新的样本。如何能够有效地对数据集数据分布进行建模并生成出可靠的样本,需要对生成式模型有更多的研究。最常用的生成式模型(生成对抗网络和变分自编码器)都有各自的不足。生成对抗网络的度量是靠数据驱动学习而得,类似黑箱系统可解释性不高,且具有训练难度大的特点;流模型处于新兴发展阶段,目前的应用局限于计算机视觉任务(人脸图像生成等),在实际场景中的应用还比较缺乏;目前的机器学习蛋白质设计方法主要分为两种:序列设计和基于结构的序列设计。序列设计考虑了数据集中蛋白质的氨基酸序列却未考虑蛋白质结构,类似于自然语言处理的方式直接对序列进行生成,缺乏对蛋白质结构信息的利用。基于结构的序列设计是以蛋白质的结构为输入条件,对氨基酸序列进行生成,此方法能够在一定程度上利用蛋白质结构信息,却难以生成出新的结构。此外,抗体设计与蛋白质设计略有不同,抗体设计生成的是CDR区的氨基酸序列,保持骨架区(Framework Region,FR区)的恒定,目前缺乏针对抗体的机器学习设计方法。
因此,将流模型与抗体的序列、结构协同设计结合,设计一个基于流模型的生成式模型是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于流模型的抗体序列结构协同设计方法;通过将蛋白质序列生成特异化到抗体序列生成,将抗体的序列和结构一同输入图神经网络,再用图神经网络分别生成序列和结构,能够得到更准确的数据分布,使得生成的抗体序列和结构更接近真实情况。
为了实现上述目的,本发明采用如下技术方案:
一种基于流模型的抗体序列结构协同设计方法,包括以下步骤:
S1、选取结构抗体数据集作为通用的抗体数据;
S2、获取氨基酸序列信息及结构信息;
S3、将序列信息及结构信息编码入图神经网络,对神经网络进行更新,得到氨基酸编码;
S4、将氨基酸编码输入至第一流模型中进行变换,得到氨基酸类型,将预测到的氨基酸类型输入图神经网络,对其进行更新,得到新的氨基酸编码;
S5、将新的氨基酸编码输入至第二流模型中进行变换,得到氨基酸的三维坐标信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210001847.6/2.html,转载请声明来源钻瓜专利网。