[发明专利]基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法在审
申请号: | 202111473384.5 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114171125A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 杨跃东;谭游海;郑双佳;戴凌雪 | 申请(专利权)人: | 中山大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B50/30;G16B15/30;G06N3/08;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 蛋白 降解 靶向 嵌合体 接物 生成 方法 | ||
本发明公开了一种基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法,包括步骤如下:使用数据增强方法扩充构建的ZINC数据集和PROTAC数据集,将得到的第一ZINC数据集和第一PROTAC数据集作为监督训练集;构建Transformer模型,并设置训练步数、网络层数、注意力层数和优化器参数;使用第一ZINC数据集训练Transformer模型,使用目标函数和反向传播算法训练更新Transformer模型;使用第一PROTAC数据集训练更新后的Transformer模型,将Transformer模型迁移至PROTAC目标域上,得到Prior先验模型;将片段对SMILES输入Prior先验模型进行批量生成,对生成PROTAC使用打分函数打分,引入强化学习的策略梯度算法,更新Agent模型;重复至PROTAC打分不再提升或者达到训练步数;利用更新后的Agent模型在给定片段对的情况下实现大规模生成符合预期属性的蛋白降解靶向嵌合体连接物。
技术领域
本发明涉及人工智能和蛋白降解靶向嵌合体设计技术领域,更具体的,涉及一种基于深度强化学习的蛋白降解靶向嵌合体连接物生成方法。
背景技术
蛋白降解靶向嵌合体(PROTAC)是一种能够诱导降解感兴趣蛋白质(POI)的双功能小分子,近些年药物发现领域对其展现了强烈的兴趣。PROTAC主要包含了三个部分:一个靶向POI的配体(弹头),一个招募E3泛素连接酶的配体和一个连接两者的连接物。由于这种双功能结构特性,PROTAC可以同时结合POI和E3连接酶形成一个三元化合物,并使得POI被打上泛素化标签,随后被送到泛素蛋白系统中由26S蛋白体降解。这一过程不同于传统小分子抑制剂的占据驱动方式来抑制蛋白功能,其依赖于诱导泛素化降解,是一种事件驱动的药物机理。
PROTAC具有许多不同于传统小分子抑制剂的优势:首先,由于事件驱动的作用模式,PROTAC不需要长时间的停留与连续的药物暴露,天然具有催化性能。此外,对POI的降解展示了其在那些缺乏酶活性位点,即在所谓的“不可成药”目标上制药的可能性。另外一个优势在于,即使是基于非选择性弹头构建的PROTAC仍然可能在三元复合物中实现不同的蛋白相互作用,从而实现PROTAC的选择性。
然而,在这个快速发展的领域,设计PROTAC仍然是一个挑战,而其中的一个关键问题在于,选择一个最佳的连接物来连接两个配体。PROTAC中的连接物已被证明是影响PROTAC结构刚性,溶解度以及选择性的关键因素,故对其的设计进行研究是十分必要的。传统的连接物设计耗时耗力耗财,其极度依赖于专家知识以及实验的迭代。一些基于软件MOE和Rosetta的计算机辅助药物设计(CADD)方法已被引入至连接物的合理设计,Drummond等人(DRUMMOND M L,WILLIAMS C I.In silico modeling of PROTAC-mediated ternarycomplexes:validation and application[J].Journal of chemical information andmodeling,2019,59(4):1634-44.)开发了一系列协议,用MOE软件生成和分析PROTAC三元复合物构象。Zaidman等人(ZAIDMAN D,PRILUSKY J,LONDON N.PRosettaC:Rosetta basedmodeling of PROTAC mediated ternary complexes[J].Journal of chemicalinformation and modeling,2020,60(10):4894-903.)开发的PRosettaC则是一个基于Rosetta的替代协议。它在蛋白-蛋白相互作用空间和PROTAC分子构象空间中的采样交替进行,最后产生锚定原子之间距离的构象集合。尽管CADD方法加快了连接物设计的速度,并为理解一些PROTAC的降解机理提供了一些新见解,但它们仍局限于验证和解释实验结果,无法高通量地自动设计出具有理想药效的新型PROTAC连接物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111473384.5/2.html,转载请声明来源钻瓜专利网。