[发明专利]一种基于多任务图神经网络的分子毒性预测方法和装置有效
申请号: | 202110542907.0 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113257369B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 姜榕;吴建盛;胡海峰;朱燕翔 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 范丹丹 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 神经网络 分子 毒性 预测 方法 装置 | ||
本发明揭示了一种基于多任务图神经网络的分子毒性预测方法和装置,该方法包括以下步骤:S1:毒性数据集的准备,得到用化学分子规范表达式表示的毒性数据;S2:使用S1步骤中得到的用化学分子规范表达式的毒性数据,生成原子节点特征向量;S3:使用S1步骤中得到的用化学分子规范表达式的毒性数据,生成边信息特征向量;S4:基于S2步骤得到的原子节点特征向量和和S3步骤得到的边信息特征向量,构建基于多任务图神经网络的分子毒性预测模型;S5:对模型进行性能验证。针对分子毒性数据集设计的多任务图神经网络,构建自动学习分子图结构信息模型,能够结合分子毒性任务间的关联性,使用多任务学习方法来提升毒性预测任务的性能。
技术领域
本发明涉及一种基于多任务图神经网络的分子毒性预测方法和装置,可用于人工智能药物技术领域。
背景技术
药物毒性是指由于化合物的作用或代谢而对生物体产生的不利影响。在药物发现的早期阶段,分子毒性预测对于提前排除在临床试验中的候选药物至关重要。新药研发失败约有30%是由于存在安全性和毒性问题而导致的,因此毒性预测在药物发现和开发周期中至关重要。
传统上通过体内生物实验来评估药物毒性通常是耗时耗力的,而基于机器学习的药物毒性预测是一种重要的补充。基于机器学习的毒性预测从化合物的分子结构出发,通过提取化合物的分子描述符或分子指纹,构建机器学习模型来预测化合物的分子毒性。
分子毒性根据作用机制或作用靶标的不同可以分为多种类型,同时这些不同类型的分子毒性任务之间存在着内在关联,如果能把这些分子毒性任务放在一起利用机器学习方法进行学习,可以有效地利用任务之间的关联信息,提升分子毒性预测模型的性能。另外,基于传统的机器学习方法做分子毒性预测时,化合物的分子特征主要通过人工进行提取,其要求研究者具有较高的专业知识背景,具有较高门槛。分子可天然表示为图结构,且不同的分子大小形状都不一样,利用图神经网络可以实现端到端的分子特征学习,不需要人工干预,这样可以降低使用者的门槛,并得到性能更好的分子特征表示,并有效提升分子毒性模型的预测能力。
目前我们想要解决的一些技术问题就是:
(1)如何能够有效利用分子毒性任务的关联性,来提高分子毒性预测性能;
(2)如何构建端到端的分子图结构学习模型,自动生成分子特征;
(3)如何有效提高训练样本数量不足情况下的分子毒性预测模型性能。
发明内容
本发明的目的就是为了解决现有技术中存在的上述问题,提出一种基于多任务图神经网络的分子毒性预测方法和装置。
本发明的目的将通过以下技术方案得以实现:一种基于多任务图神经网络的分子毒性预测方法,该方法包括以下步骤:
S1:毒性数据集的准备,得到用SMILES化学分子规范表达式表示的毒性数据;
S2:使用S1步骤中得到的用化学分子规范表达式的毒性数据,生成原子节点特征向量;
S3:使用S1步骤中得到的用化学分子规范表达式的毒性数据,生成边信息特征向量;
S4:基于S2步骤得到的原子节点特征向量和和S3步骤得到的边信息特征向量,构建基于多任务图神经网络的分子毒性预测模型;
S5:对S4步骤得到的分子毒性预测模型进行模型性能的验证。
优选地,所述S1步骤包括以下步骤:
S11:收集包含分子毒性的数据,将所有包含相关毒性的化合物用化学分子规范表达式SMILES描述;
S12:对化合物进行结构标准化、盐的清洗处理,去除混合物、无机物和有机金属,保留具有明确毒性标签的分子;
S13:将数据集按一定比例随机分为训练集和测试集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110542907.0/2.html,转载请声明来源钻瓜专利网。