[发明专利]一种抗体蛋白CDR区域氨基酸序列预测方法及系统在审
申请号: | 202111090958.0 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113838523A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 陈亮;邓新宇;梁楚哼;梁国龙 | 申请(专利权)人: | 深圳太力生物技术有限责任公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B30/00;G16B40/00 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 胡星驰 |
地址: | 518048 广东省深圳市福田区福保*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 抗体 蛋白 cdr 区域 氨基酸 序列 预测 方法 系统 | ||
1.一种基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其特征在于,包括以下步骤:
(1)获取抗体结合的氨基酸序列信息;
(2)将步骤(1)获得的抗体结合的氨基酸序列信息,输入到训练后的基于自然语言处理的深度学习模型,获得包含抗体CDR区域的氨基酸序列。
2.如权利要求1所述的基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其特征在于,步骤(1)所述与抗体结合的氨基酸序列信息为抗原的氨基酸序列或抗原表位的氨基酸序列。
3.如权利要求1所述的基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其特征在于,步骤(2)所述包含抗体CDR区域的氨基酸序列为以下之一:
抗体的氨基酸序列,包括重链氨基酸序列以及轻链氨基酸序列;
抗体CDR区域,为重链上三个CDR区域以及轻链上三个CDR区域之一;
抗体CDR区域集,为重链上三个CDR区域以及轻链上三个CDR区域。
包含抗原表位氨基酸序列信息为以下之一:
抗原表位上的多个与同一CDR区域接触的片段拼接而成的序列;
抗原表位上多个与同一CDR区域接触的片段及其之间氨基酸片段形成的连续序列;
抗原的完整氨基酸序列。
4.如权利要求1所述的基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其特征在于,所述基于自然语言处理的深度学习模型,为基于CNN架构的ConvS2S、基于RNN架构的LSTM、GRU、Attention-RNN、基于Transformer架构的BERT、或GPT;
所述基于自然语言处理的深度学习模型,对所述抗体结合的氨基酸序列进行编码,优选采用氨基酸物理化学性质作为向量特征,经基于深度学习的编码、解码模型后,输出预测的能够与该抗原或抗原表位特异性结合的包含抗体CDR区域的氨基酸序列以及其预测概率;所述氨基酸的物理化学性质包括但不限于贝塔链指数、疏水性因子、和/或亲水率。
5.如权利要求1所述的基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其特征在于,所述基于自然语言处理的深度学习模型按照如下方法训练获取:
(2-1)获取样本数据集,以抗原与抗体间的氨基酸中除氢原子以外原子欧几里得距离小于预设阈值为标准,符合标准则认定抗原抗体特异性结合,收集抗原抗体结合对数据;对于抗原抗体结合对,提取其中抗原表位的氨基酸序列以及所述包含抗体CDR区域的氨基酸序列,作为样本数据集;
(2-2)采用步骤(2-1)中获取的样本数据集进行交叉验证,对所述自然语言处理的深度学习模型进行监督学习,使得预测的抗体氨基酸序列要尽可能与数据对中真实的抗体氨基酸序列相一致,即损失函数最小,获得训练后的基于自然语言处理的深度学习模型。
6.如权利要求5所述的基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其特征在于,所述基于自然语言处理的深度学习模型的损失函数为交叉熵损失函数。
7.一种抗体蛋白CDR区域氨基酸序列预测系统,其特征在于,包括:抗体结合的氨基酸序列信息获取模块、基于自然语言处理的抗体序列输出模块;
所述抗体结合的氨基酸序列信息获取模块,用于获取抗体结合的氨基酸序列信息,并提交给抗体序列输出模块;
所述抗体序列输出模块,包括基于自然语言处理的深度学习模型,用于将抗体结合的氨基酸序列信息,处理为词向量特征,并采用经训练收敛的深度学习模型,输出预测的能够与该抗原或抗原表位特异性结合的包含抗体CDR区域的氨基酸序列。
8.如权利要求7所述的抗体蛋白CDR区域氨基酸序列预测系统,其特征在于,所述抗体结合的氨基酸序列信息获取模块包括抗原表位预测子模块,其用于根据输入的抗原氨基酸序列预测抗原表位序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳太力生物技术有限责任公司,未经深圳太力生物技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111090958.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基坑钢支撑法兰拼装段保护装置
- 下一篇:一种寄生单元加载的高增益双频微带天线