[发明专利]基于门控注意力机制的靶标-配体结合亲和力的深度学习预测方法在审
申请号: | 202210394865.5 | 申请日: | 2022-04-15 |
公开(公告)号: | CN114743600A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 刘奇磊;都健;赵雨靓;张磊;吴心远;孟庆伟 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B5/00;G16B15/00;G16B50/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 王海波 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 门控 注意力 机制 靶标 结合 亲和力 深度 学习 预测 方法 | ||
本发明涉及基于门控注意力机制的靶标‑配体结合亲和力的深度学习预测方法,属于计算机辅助药物设计技术以及生物和药物信息学领域。深度学习模型从配体的SMILES字符串和蛋白质的氨基酸序列开始,然后分别转换为配体矩阵和蛋白质矩阵。配体矩阵被送到全连接层和基于门增强的注意力层用于特征提取,将蛋白质矩阵送到一维卷积层和最大池化层,然后再送入基于门增强的注意力层。最后,通过矩阵行的加和来聚合配体矩阵的处理特征,并对蛋白质矩阵执行相同的过程,然后将两者拼接在一起送入后续的全连接层以预测蛋白质‑配体复合物的高/低结合亲和力的概率。本发明有效减少与实验分析相关的时间和成本,提高药物设计和虚拟筛选的效率。
技术领域
本发明涉及计算机辅助药物设计技术以及生物和药物信息学领域,尤其涉及一种靶标-配体结合亲和力预测方法。
背景技术
大多数生物过程由生物分子识别决定,其中蛋白质通常作为靶标与配体相互作用以调节生物功能,例如酶催化,信号转导等。靶标-配体相互作用的研究是重要的课题。靶标-配体相互作用的结合强度(以实数衡量)的数量通常定义为结合亲和力,可以通过抑制常数Ki、解离常数Kd和半数最大抑制浓度IC50来量化。现有药物大部分都是具有生物活性的小分子化合物,识别与靶蛋白具有高亲和力的配体(小分子候选药物)是药物发现早期的一项主要任务。
实验试错方法确定靶标-配体的亲和力存在耗时费力的问题。基于半经验的3D-定量构效关系模型虽预测靶标-配体亲和力的准确度高,且解释性强,但其通用性差,仅适用于某一类骨架的分子。基于物理驱动的方法(如分子动力学方法)具有较高的准确性和良好的解释性,然而巨大的计算时间成本阻碍了其在高通量筛选中的应用。相比于分子动力学方法,分子对接方法可大幅降低计算时间成本,但也牺牲了较多精度。基于数据驱动的方法(如机器学习方法)计算速度极快,然而大多数机器学习算法仍依赖专家知识进行特征提取/选择,在大数据集中难以权衡准确性和通用性。在海量数据和强大的并行计算能力推动下,由传统机器学习方法进一步发展得到的深度学习方法具有更强的数据拟合能力,尽管目前已提出了许多深度学习模型来预测结合亲和力,但大多数需要靶标-配体复合物的3D结构特征,与文本特征相比,3D结构特征不容易获得。
发明内容
针对现有技术存在的上述问题,本发明的目的是充分利用文本特征的优势,开发一种端到端的基于门控注意力机制的深度学习模型,以快速识别具有高结合亲和力的靶标-配体复合物。
为实现上述目的,本发明采用如下技术方案,包括以下具体步骤:
基于门控注意力机制的靶标-配体结合亲和力的深度学习预测方法,包括以下具体步骤:
步骤1:建立结合亲和力数据库,用于后续的深度学习模型。
步骤2:将配体的SMILES字符串转换为配体矩阵,作为深度学习模型的输入。
步骤3:将蛋白质的氨基酸序列转换为蛋白质矩阵,作为深度学习模型的输入。
步骤4:构建用于模型训练的深度学习模型的架构,将配体矩阵送到一个全连接层和一个基于门增强的注意力层用于特征提取,通过矩阵行的加和方式来聚合配体片段的特征向量。
步骤5:将蛋白质矩阵先送到一维卷积层和最大池化层,以减少蛋白质矩阵的行数,然后再送入基于门增强的注意力层用于特征提取,通过矩阵行的加和方式来聚合蛋白质高阶氨基酸的特征向量。
步骤6:将聚合后的配体片段的特征向量与蛋白质高阶氨基酸的特征向量拼接在一起送入后续的全连接层以预测靶标-配体复合物的高/低结合亲和力的概率。
进一步地,步骤1具体包括:根据以下标准对结合亲和力数据库进行预处理:
步骤1.1:删除涉及IC50性质的条目,保留涉及Ki和Kd性质的条目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210394865.5/2.html,转载请声明来源钻瓜专利网。