[发明专利]生成蛋白结构约束分布的方法和蛋白设计方法有效
申请号: | 202210002689.6 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114023378B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 张琳;王天元;吴炜坤;李远鹏;翟珂 | 申请(专利权)人: | 北京晶泰科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B15/00;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 蛋白 结构 约束 分布 方法 设计 | ||
1.一种生成蛋白结构约束分布的方法,其特征在于,包括:
S1、获取随机生成的指定序列长度的第一蛋白序列;
S2、采用多层神经网络模型得到所述第一蛋白序列的蛋白结构约束分布;
S3、基于预设motif的蛋白结构约束分布,背景蛋白的蛋白结构约束分布,和所述第一蛋白序列的蛋白结构约束分布,计算所述第一蛋白序列的损失函数值;
其中,所述S3包括:
基于所述第一蛋白序列的蛋白结构约束分布与所述预设motif的蛋白结构约束分布,得到第一损失函数值;
基于所述第一蛋白序列的蛋白结构约束分布与所述背景蛋白的蛋白结构约束分布,得到第二损失函数值;
对所述第一损失函数值和所述第二损失函数值进行加权处理,得到所述第一蛋白序列的损失函数值;
S4、采用反向传播加梯度下降的方法,更新所述第一蛋白序列得更新后的第一蛋白序列;
S5、将更新后的第一蛋白序列作为所述第一蛋白序列,并重复所述S2、S3和S4预设次数,得到多个损失函数值;
S6、从所述多个损失函数值中选择符合第一预设规则的损失函数值对应的蛋白结构约束分布作为最终的蛋白结构约束分布;其中,所述第一预设规则为损失函数值最低的一个或多个。
2.根据权利要求1所述的方法,其特征在于,基于所述第一蛋白序列的蛋白结构约束分布与所述预设motif的蛋白结构约束分布,得到第一损失函数值,包括:
确定motif在所述第一蛋白序列中的位置;
依据所述位置,获取所述第一蛋白序列的蛋白结构约束分布中的motif的蛋白结构约束分布;
依据所述motif的蛋白结构约束分布与所述预设motif的蛋白结构约束分布,得到所述第一损失函数值。
3.根据权利要求2所述的方法,其特征在于,确定motif在所述第一蛋白序列中的位置,采用的方式为如下至少之一:
基于不同motif之间的位置顺序,随机确定一个位置为放置任意一段motif的位置,其中,所述不同motif之间的位置不重合且相互之间不相连,且所述不同motif之间的位置顺序通过随机的方式进行确定;
从所述第一蛋白序列中确定与每段motif的结构特征相似度最高的位置,并将所述结构特征相似度最高的位置确定为所述motif的位置。
4.根据权利要求1所述的方法,其特征在于,基于所述第一蛋白序列的蛋白结构约束分布与所述背景蛋白的蛋白结构约束分布,得到第二损失函数值,包括:
依据所述第一蛋白序列的长度,获取所述背景蛋白的蛋白结构约束分布;
依据所述第一蛋白序列的蛋白结构约束分布与所述背景蛋白的蛋白结构约束分布,得到所述第二损失函数值。
5.根据权利要求1所述的方法,其特征在于,所述S2包括:
从所述第一蛋白序列中提取序列特征;
采用所述多层神经网络模型对所述序列特征进行分析,预测得到所述第一蛋白序列的蛋白结构约束分布,其中,所述蛋白结构约束分布表征相应蛋白序列中不同氨基酸之间的相对位置的分布情况。
6.根据权利要求1所述的方法,其特征在于,采用反向传播加梯度下降的方法,对所述第一蛋白序列进行更新,得到更新后的第一蛋白序列,包括:
依据所述第一蛋白序列的损失函数值,计算得到损失计算梯度;
将所述第一蛋白序列按照所述损失计算梯度的反方向进行更新,得到更新后的第一蛋白序列。
7.一种蛋白设计方法,其特征在于,根据权利要求1所述的方法获得的最终的蛋白结构约束分布进行蛋白设计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶泰科技有限公司,未经北京晶泰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210002689.6/1.html,转载请声明来源钻瓜专利网。