[发明专利]模型训练、抗体改造和结合位点预测的方法与装置有效
申请号: | 202110594661.1 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113764037B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 蒋彪彬;许振雷;刘伟;黄俊洲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B15/30;G16B40/00 |
代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 抗体 改造 结合 预测 方法 装置 | ||
本申请实施例提供一种模型训练、抗体改造和结合位点预测的方法与装置,训练方法包括:使用N条第一抗体序列,对预测模型进行预训练,得到预训练后的预测模型,其中第一抗体序列中未标注出所述第一抗体序列与抗原的结合位点,预训练后的预测模型用于预测抗体序列中被掩盖的氨基酸的预测值。由于未标注的第一抗体系列的数量较多,使用大量的第一抗体序列对预测模型进行预训练,可以使该预测模型得到充分的训练,进而提高了预测模型的训练准确性。另外,在预测模型的预训练过程中,对第一抗体序列的可变区进行着重学习,以进一步提高预测模型的训练准确度,使用该预测模型进行抗体相关预测工作时,其预测成本低,且预测效率高。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种模型训练、抗体改造和结合位点预测的方法与装置。
背景技术
抗体是一种重要的免疫蛋白,负责识别生物体内的外来入侵者或内在的变异,即抗原,并与抗原进行结合,以清除抗原。
抗体重要的性质是与抗原结合的亲和力,亲和力大小由抗体与抗原的结合位点决定。在抗体亲和力不够高时,需要对抗体进行改造,以提高抗体亲和力。
目前对抗体的相关预测工作,主要依赖于结构解析实验或分子敲除筛选实验,其成本高,且耗时。
发明内容
本申请实施例提供一种模型训练、抗体改造和结合位点预测的方法与装置,以降低抗体相关预测工作的成本,提高预测效率。
第一方面,本申请实施例提供一种用于抗体的预测模型的训练方法,包括:
获取N条第一抗体序列,所述N为正整数,所述第一抗体序列中未标注出所述第一抗体序列与抗原的结合位点;
使用所述N条第一抗体序列,对预测模型进行预训练,得到预训练后的预测模型,所述预训练后的预测模型用于预测抗体序列中被掩盖的氨基酸的预测值,在所述预测模型的预训练过程中,所述第一抗体序列的可变区的学习频率高于所述第一抗体序列的不可变区的学习频率。
第二方面,本申请实施例提供一种预测抗体中改造点的预测值的方法,包括:
获取待改造的目标抗体序列;
接收所述用户对所述目标抗体序列中待改造的目标位点氨基酸的掩盖操作;
响应于所述掩盖操作,将目标位点氨基酸被掩盖的所述目标抗体序列输入预训练的预测模型中,得到所述预训练的预测模型输出的所述目标位点氨基酸的预测值;
其中,所述预训练的预测模型是经过第一抗体序列训练得到的,所述第一抗体序列中未标注出所述第一抗体序列与抗原的结合位点,在所述预测模型的预训练过程中,所述第一抗体序列的可变区的学习频率高于所述第一抗体序列的不可变区的学习频率。
在一些实施例中,所述获取待改造的目标抗体序列,包括:
显示输入框,并接收所述用户在所述输入框内输入的待改造的目标抗体序列。
在一些实施例中,所述响应于所述掩盖操作,将目标位点氨基酸被掩盖的所述目标抗体序列输入预训练后的预测模型中,得到所述预训练后的预测模型输出的所述目标位点氨基酸的预测值,包括:
在检测到所述用户的预测触发操作时,响应于所述掩盖操作,将所述目标位点氨基酸被掩盖的所述目标抗体序列输入预训练后的预测模型中,得到所述预训练后的预测模型输出的所述目标位点氨基酸的预测值。
第三方面,本申请实施例提供一种抗体结合位点的预测方法,包括:
获取待预测的目标抗体序列;
将所述目标抗体序列输入目标预测模型中,预测所述目标抗体序列与抗原的结合位点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594661.1/2.html,转载请声明来源钻瓜专利网。