[发明专利]一种抗体蛋白CDR区域氨基酸序列预测方法及系统在审
申请号: | 202111090958.0 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113838523A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 陈亮;邓新宇;梁楚哼;梁国龙 | 申请(专利权)人: | 深圳太力生物技术有限责任公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B30/00;G16B40/00 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 胡星驰 |
地址: | 518048 广东省深圳市福田区福保*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 抗体 蛋白 cdr 区域 氨基酸 序列 预测 方法 系统 | ||
本发明公开了一种抗体蛋白CDR区域氨基酸序列预测方法及系统。本发明包括以下步骤:(1)获取抗体结合的氨基酸序列信息;(2)将步骤(1)获得的抗体结合的氨基酸序列信息,输入到训练后的基于自然语言处理的深度学习模型,获得包含抗体CDR区域的氨基酸序列。本发明采用NLP模型对抗体结合的氨基酸序列信息和抗体序列进行端到端的训练,从而准确的预测包含抗体CDR区域的氨基酸序列,将抗体序列发现时间缩短至数个小时,此外在多线程情况下,数个项目可同时进行,大大缩短研发周期,节省研发成本。
技术领域
本发明属于生物技术领域,更具体地,涉及一种基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法及系统。
背景技术
抗原抗体都是由氨基酸序列组成的多肽,其中抗体结构较为复杂。以Y型双链蛋白IgG抗体为例,是由轻链(Light Chain),重链(Heavy Chain)组成的具有三维结构的蛋白质。轻链和重链都包括可变区(VL,VH)和恒定区(CL,CH),顾名思义可变区是氨基酸序列变化较大的区域,该区域存在可以与抗原特异性结合的部位,称为抗原结合位点。IgG抗体有3个环状结构,而可变区中又有部分区域的序列高度变化,称为高变区或抗原互补决定区(complementarity determining region,CDR)。通常CDR区域有多个环状结构与抗原特异性结合。可变区中非CDR部分为骨架区(framework region,FR),其氨基酸组成和排列变化相对CDR少,通常CDR与FR组成“FR-CDR1-FR-CDR2-FR3-DCR3-FR4”。
抗体类药物的研发需要在早期确定抗体序列,一个序列的好坏很大程度上决定了药物研发成功的概率。传统的序列发现通常利用动物免疫法和抗体库筛选法进行筛选,随后通过测序等手段获得目的序列。动物免疫法周期超过1年,很多靶点抗原的制备非常困难,免疫动物时也会有动物不产生免疫反应的情况,单克隆杂交瘤的制备及序列人源化都是技术难点,整个流程费时费力;抗体库筛选法往往受制于库容量的大小,并存在抗体轻重链不匹配及经常筛选到假阳性背景序列的问题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法及系统,其目的在于通过将抗体结合的氨基酸序列信息如抗原表位序列,类比为语言的词组序列,巧妙的采用自然语言处理过程的seq2seq模型,预测相应的抗体蛋白CDR区域氨基酸序列,由此解决现有技术采用动物免疫法获得抗体序列周期长、试验成本高的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其包括以下步骤:
(1)获取抗体结合的氨基酸序列信息;
(2)将步骤(1)获得的抗体结合的氨基酸序列信息,输入到训练后的基于自然语言处理的深度学习模型,获得包含抗体CDR区域的氨基酸序列。
优选地,所述基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其步骤(1)所述与抗体结合的氨基酸序列信息为抗原的氨基酸序列或抗原表位的氨基酸序列。
优选地,所述基于自然语言处理的抗体蛋白CDR区域氨基酸序列预测方法,其步骤(2)所述包含抗体CDR区域的氨基酸序列为以下之一:
抗体的氨基酸序列,包括重链氨基酸序列以及轻链氨基酸序列;
抗体CDR区域,为重链上三个CDR区域以及轻链上三个CDR区域之一;
抗体CDR区域集,为重链上三个CDR区域以及轻链上三个CDR区域。
包含抗原表位氨基酸序列信息为以下之一:
抗原表位上的多个与同一CDR区域接触的片段拼接而成的序列;
抗原表位上多个与同一CDR区域接触的片段及其之间氨基酸片段形成的连续序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳太力生物技术有限责任公司,未经深圳太力生物技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111090958.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基坑钢支撑法兰拼装段保护装置
- 下一篇:一种寄生单元加载的高增益双频微带天线