[发明专利]基于深度学习和计算模拟的蛋白质变构调节剂的识别方法有效
申请号: | 202211500668.3 | 申请日: | 2022-11-28 |
公开(公告)号: | CN115938488B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 蒲雪梅;陈建芳;陈欣;毛俊;刘静 | 申请(专利权)人: | 四川大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B15/20;G16B20/30;G16B5/30;G06N3/0464;G06N3/09;G06N3/088 |
代理公司: | 四川省天策知识产权代理有限公司 51213 | 代理人: | 张秀敏 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 计算 模拟 蛋白 质变 调节剂 识别 方法 | ||
1.一种基于深度学习和计算模拟的蛋白质变构调节剂的识别方法,其特征在于,包括:
步骤S100、使用高斯加速分子动力学模拟获取结合内源性激动剂的蛋白质复合物的MD模拟轨迹;
步骤S200、使用无监督聚类分析将蛋白质复合物的MD模拟轨迹进行初步分类,并且生成聚类标签;
步骤S300、将MD模拟轨迹和聚类标签用于训练基于卷积神经网络CNN的分类模型MDCNN,CNN模型从MD模拟轨迹中识别出不同的构象态,MDCNN中的模型解释器LIME在识别功能状态的同时寻找到每个构象态的关键结构和关键残基,借助LIME反馈的关键残基辅助挑选有价值的构象态,用于后续变构位点预测;
步骤S400、根据MDCNN中各构象态的关键残基,挑选出有价值的构象态输入位点预测工具FTSite进行变构位点预测,除去正构位点之外得分最高的位点被认为是潜在的变构位点;
步骤S500、针对预测得到的潜在的变构位点使用基于结构的虚拟筛选方法得到结合最稳定的潜在变构调节剂,输出蛋白质复合物结构;
步骤S600、借助动态网络分析揭示潜在药物分子的变构调控机制,确认潜在药物分子的性质。
2.根据权利要求1所述的基于深度学习和计算模拟的蛋白质变构调节剂的识别方法,其特征在于,所述步骤S100具体包括:
步骤S110、获取目标蛋白质的非激活态晶体结构;
步骤S120、删除晶体结构中除了目标蛋白以外的其他组分,重新构建晶体结构中缺失的结构区域,使得目标蛋白质的结构完整;
步骤S130、获取蛋白质内源性激动剂的结构,然后使用分子对接并选取得分最高的合理对接位姿构建蛋白质-内源性激动剂的复合物结构;
步骤S140、在目标蛋白质的生理环境下对蛋白质和配体进行质子化,构建与生理环境类似的模拟体系;
步骤S150、针对构建完成的模拟体系,经过系统最小化和加热之后,在NPT系综下进行无约束的动力学模拟cMD将模拟体系运行至一个相对平衡的状态,cMD平衡后的最后一个结构作为高斯加速分子动力学模拟的起始结构,开始运行高斯加速分子动力学模拟程序。
3.根据权利要求2所述的基于深度学习和计算模拟的蛋白质变构调节剂的识别方法,其特征在于,所述步骤S200具体包括:
步骤S210、从蛋白质复合物高斯加速MD轨迹中,间隔提取蛋白质的构象从而形成代表整段轨迹的蛋白质构象集,计算用于区分构象态的构象特征;
步骤S220、将构象特征作为聚类指标,使用无监督的聚类分析算法对蛋白质构象进行聚类,选出最佳的聚类结果作为蛋白质构象集的标签。
4.根据权利要求3所述的基于深度学习和计算模拟的蛋白质变构调节剂的识别方法,其特征在于,所述步骤S300具体包括:
步骤S310、数据处理:使用S210中得到的蛋白质构象集,使用蛋白质Cα原子叠加以消除整体旋转和平移,删除所有的氢原子,然后将其他原子的坐标被转成RGB坐标,从而得到数据集;
步骤S320、添加标签:将S220中得到的蛋白质构象集的标签作为数据标签读入,数据集与数据标签一一对应,用于标明数据集中的构象属于哪一类;
步骤S330、数据集划分:对数据进行分组以消除模拟时序的影响,然后按照预设的比例随机划分为训练集和验证集,对数据集进行K折划分,得到K折交叉验证数据集,其中,1≤K<10,K为整数;
步骤S340、模型的构建:将数据集作为输入,训练基于卷积神经网络CNN的分类模型MDCNN,用于蛋白质构象态分类识别,训练和验证过程采用K折交叉验证,再使用准确度ACC来评估分类器的性能;
步骤S350、构建模型解释器:构造LIME解释器通过局部线性拟合的方式对MDCNN的预测结果进行解释,寻找到每个构象态的关键结构和关键残基;
步骤S360、将残基中包含的所有原子得分相加,得到蛋白质每个残基的重要性评分,通过排序选取评分排名前列的残基,视为该类构象态的重要残基。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211500668.3/1.html,转载请声明来源钻瓜专利网。