[发明专利]生成蛋白结构约束分布的方法和蛋白设计方法有效
申请号: | 202210002689.6 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114023378B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 张琳;王天元;吴炜坤;李远鹏;翟珂 | 申请(专利权)人: | 北京晶泰科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B15/00;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 蛋白 结构 约束 分布 方法 设计 | ||
本申请公开了一种生成蛋白结构约束分布的方法和蛋白设计方法。该方法包括:获取随机生成的指定序列长度的第一蛋白序列;采用多层神经网络模型得到第一蛋白序列的蛋白结构约束分布;计算第一蛋白序列的损失函数值;采用反向传播加梯度下降的方法,更新第一蛋白序列得更新后的第一蛋白序列;将更新后的第一蛋白序列作为第一蛋白序列,并重复上述步骤预设次数,得到多个损失函数值;从多个损失函数值中选择符合第一预设规则的损失函数值对应的蛋白结构约束分布作为最终的蛋白结构约束分布。通过本申请,解决了相关技术中获取蛋白结构约束分布的效率较低的问题。
技术领域
本申请涉及生物科技技术领域,具体而言,涉及一种生成蛋白结构约束分布的方法和蛋白设计方法。
背景技术
蛋白质在生命活动中是普遍存在且不可或缺的,它在生物体内承担了多种多样的生物学功能,具有相似结构信息的蛋白质往往会拥有相类似的生物学功能。蛋白结构约束分布是指蛋白序列中氨基酸之间的相对位置(包括距离、角度、二面角等)的分布,通过蛋白结构约束分布可以生成完整蛋白骨架,进而可以进行蛋白设计。所以生成包含固定motif的蛋白结构约束分布是至关重要的。
相关技术一中,生成蛋白结构约束分布需要大量的蛋白设计专家的人工经验和直觉,因此受人工影响较大,效率较低。
相关技术二中,生成蛋白结构约束分布是需要提前制备大量的骨架库,因此,依赖骨架库的好坏、生成蛋白的大小受骨架库限制。
发明内容
本申请的主要目的在于提供一种生成蛋白结构约束分布的方法和蛋白设计方法,以解决相关技术中获取蛋白结构约束分布过程中存在的部分或全部问题。
为了实现上述目的,根据本申请的一个方面,提供了一种生成蛋白结构约束分布的方法。该方法包括:S1、获取随机生成的指定序列长度的第一蛋白序列;S2、采用多层神经网络模型得到所述第一蛋白序列的蛋白结构约束分布;S3、基于预设motif的蛋白结构约束分布,背景蛋白的蛋白结构约束分布,和所述第一蛋白序列的蛋白结构约束分布,计算所述第一蛋白序列的损失函数值;S4、采用反向传播加梯度下降的方法,更新所述第一蛋白序列得更新后的第一蛋白序列;S5、将更新后的第一蛋白序列作为所述第一蛋白序列,并重复所述S2、S3和S4预设次数,得到多个损失函数值;S6、从所述多个损失函数值中选择符合第一预设规则的损失函数值对应的蛋白结构约束分布作为最终的蛋白结构约束分布。
进一步地,所述S3,包括:基于所述第一蛋白序列的蛋白结构约束分布与所述预设motif的蛋白结构约束分布,得到第一损失函数值;基于所述第一蛋白序列的蛋白结构约束分布与所述背景蛋白的蛋白结构约束分布,得到第二损失函数值;对所述第一损失函数值和所述第二损失函数值进行加权处理,得到所述第一蛋白序列的损失函数值。
进一步地,基于所述第一蛋白序列的蛋白结构约束分布与所述预设motif的蛋白结构约束分布,得到第一损失函数值,包括:确定motif在所述第一蛋白序列中的位置;依据所述位置,获取所述第一蛋白序列的蛋白结构约束分布中的motif的蛋白结构约束分布;依据所述motif的蛋白结构约束分布与所述预设motif的蛋白结构约束分布,得到所述第一损失函数值。
进一步地,确定motif在所述第一蛋白序列中的位置,采用的方式为如下至少之一:基于不同motif之间的位置顺序,随机确定一个位置为放置任意一段motif的位置,其中,所述不同motif之间的位置不重合且相互之间不相连,且所述不同motif之间的位置顺序通过随机的方式进行确定;从所述第一蛋白序列中确定与每段motif的结构特征相似度最高的位置,并将所述结构特征相似度最高的位置确定为所述motif的位置。
进一步地,基于所述第一蛋白序列的蛋白结构约束分布与所述背景蛋白的蛋白结构约束分布,得到第二损失函数值,包括:依据所述第一蛋白序列的长度,获取所述背景蛋白的蛋白结构约束分布;依据所述第一蛋白序列的蛋白结构约束分布与所述背景蛋白的蛋白结构约束分布,得到所述第二损失函数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶泰科技有限公司,未经北京晶泰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210002689.6/2.html,转载请声明来源钻瓜专利网。