[发明专利]一种基于多任务学习的分子性能预测方法及系统在审

申请号：	202211167723.1	申请日：	2022-09-23
公开（公告）号：	CN115565613A	公开（公告）日：	2023-01-03
发明（设计）人：	谭筝;李颜;史卫梅;杨仕清	申请（专利权）人：	成都职业技术学院
主分类号：	G16C10/00	分类号：	G16C10/00;G16C20/70;G16C20/90;G16C60/00;G06N3/04;G06N3/08
代理公司：	成都九鼎天元知识产权代理有限公司 51214	代理人：	周浩杰
地址：	610095 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于任务学习分子性能预测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于多任务学习的分子性能预测方法及系统，属于材料性能分析预测领域，包括步骤：S1，分子特征向量抽取，以及基准回归器选取；S2，样本内一阶模型训练，及元变量生成；S3，样本内二阶模型训练；S4，样本外一阶模型预测；S5，样本外二阶模型预测；S6，确定预测评价指标；S7，对基于图像学习的多任务堆叠模型，将元变量在池化过程后水平连接到图神经网络GNN的分子向量，用于以表示扩展的分子特征空间；S8，多层堆叠的多任务模型衍生。本发明在性能预测精度上得到进一步提升，并普遍适用于化学信息学，生物医药性能预测，分子材料设计等应用领域。

技术领域

本发明涉及材料性能分析预测领域，更为具体的，涉及一种基于多任务学习的分子性能预测方法及系统。

背景技术

化学信息学领域在化学建模(如定量结构-活性关系，QSAR)中一直大量使用机器学习方法。随着深度学习方法的出现，机器学习在科学界引起了越来越多的关注。据报道，从化学研究的角度来看，从量子特性到对人体的测量的影响，机器学习能够为探索QSAR提供更准确和有效的模型框架。相关应用包括量子化学性能预测、生物物理性能预测、生理性能预测和虚拟筛选等。

从材料和分子设计的角度，我们一般需要同时预测分子的多个性能，并对多个性能进行同时优化。而当前大多数材料人工智能模型，仅只能对材料的其中一个性能进行预测，如要对N个性能进行预测，则需要建立N个模型，分别对其进行训练和预测。此为单任务模型的框架，该方法成本相对较高，计算效率也较低。目前比较有吸引力的分子多任务学习框架，基本上遵循深度神经网络结构，其中输出神经元是基于隐藏层神经元的线性组合从而预测各个目标，即在深度网络的最后输出层，同时输出N的目标的预测值。该方法虽然对计算效率有所提升，但相较于独立的回归基准模型，其性能预测精度并没有提升，甚至会出现预测精度下降的情况。对存在同时预测大量分子性能的案例，模型的可解释性也较低。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于多任务学习的分子性能预测方法及系统，性能预测精度上得到进一步提升，并普遍适用于化学信息学，生物医药性能预测，分子材料设计等应用领域。

本发明的目的是通过以下方案实现的：

一种基于多任务学习的分子性能预测方法，包括以下步骤：

S1，分子特征向量抽取，以及基准回归器选取；

S2，样本内一阶模型训练，及元变量生成；

S3，样本内二阶模型训练；

S4，样本外一阶模型预测；

S5，样本外二阶模型预测；

S6，确定预测评价指标；

S7，对基于图像学习的多任务堆叠模型，将元变量在池化过程后水平连接到图神经网络GNN的分子向量，用于表示扩展的分子特征空间；

S8，多层堆叠的多任务模型衍生。