[发明专利]一种基于轻量级深度卷积网络的蛋白质扭转角预测方法有效
申请号: | 202110759327.7 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113611354B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 杨伟;文云光;李艳萍;葛文庚 | 申请(专利权)人: | 河南大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00;G16B50/30;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 475001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轻量级 深度 卷积 网络 蛋白质 扭转 预测 方法 | ||
1.一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,包括:
步骤1:基于PISCES服务器构建蛋白质扭转角数据集,所述蛋白质扭转角数据集包括多个蛋白质序列;
步骤2:采用BioPython从RCSB PDB数据库中抽取所述蛋白质扭转角数据集中各蛋白质序列中每个氨基酸残基对应的扭转角Phi和Psi,并将所述扭转角Phi和Psi加入蛋白质扭转角数据集中;
步骤3:将uniref90数据库与蛋白质扭转角数据集中的各蛋白质序列进行多序列比对,生成对应蛋白质序列的PSSM谱矩阵,基于蛋白质序列的PSSM谱矩阵及氨基酸的物理化学特性,构造蛋白质序列特征;
所述步骤3包括:
对于蛋白质扭转角数据集中的每个蛋白质序列,通过调用PSI-BLAST程序将其与uniref90数据库中的蛋白质序列执行多序列比对,生成对应蛋白质序列的PSSM谱矩阵,在PSSM谱矩阵中,每个氨基酸残基对应一个20维的数值向量;将该向量与表示蛋白质序列对应的氨基酸物理化学特性的7维数值向量进行拼接,获得蛋白质序列的最终特性表示;
步骤4:设计残差模块,并基于设计的残差模块构建预测蛋白质扭转角的深度卷积网络模型;所述残差模块涉及的计算操作包括:一维卷积、一维批处理归一化、Hard-Swish激活函数、平均池化、全连接和残差连接;
步骤5:构建训练预测蛋白质扭转角的深度卷积网络模型的损失函数;
步骤6:基于构建的损失函数训练预测蛋白质扭转角的深度卷积网络模型;
步骤7:基于训练后的预测蛋白质扭转角的深度卷积网络模型进行蛋白质扭转角的预测。
2.根据权利要求1所述的一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,所述步骤1包括:
基于PISCES服务器从蛋白质结构数据库中挑选出分辨率小于和序列一致性低于25%的蛋白质序列m个,加入蛋白质扭转角数据集中。
3.根据权利要求2所述的一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,在所述步骤2之后,还包括:
将蛋白质扭转角数据集划分为训练集、验证集和测试集。
4.根据权利要求1所述的一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,所述残差模块中一维卷积运算的表达式为:
其中,是卷积运算,xin和xout分别是卷积的输入张量和输出张量,k是卷积核,b是偏置向量。
5.根据权利要求1所述的一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,所述残差模块使用的Hard-Swish激活函数的表达式为:
其中x为输入数据;relu6(x+3)表示把x+3小于0的变成0,大于6的取6。
6.根据权利要求1所述的一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,所述残差模块使用的一维卷积为深度可分离一维卷积。
7.根据权利要求1所述的一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,构建的预测蛋白质扭转角的深度卷积网络模型中,对于给定的蛋白质序列,卷积网络为每个氨基酸残基输出四个值:sin(φ),cos(φ),sin(ψ)和cos(ψ);则扭转角Phi和Psi的值分别通过φ=arctan(sin(φ)/cos(φ))和ψ=arctan(sin(ψ)/cos(ψ))进行计算。
8.根据权利要求1所述的一种基于轻量级深度卷积网络的蛋白质扭转角预测方法,其特征在于,所述步骤5中的损失函数为:
其中N是mini-batch中的蛋白质序列个数,L是蛋白质序列的长度,4表示扭转角Psi和Phi的正弦值及余弦值组成的向量长度,λ是权值衰减的正则化参数,W为卷积网络的权值参数,是预测网络的输出,Y∈RN×L×4为对应的真实张量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110759327.7/1.html,转载请声明来源钻瓜专利网。