[发明专利]一种基于样本-任务关系图的元学习分子属性预测方法在审
| 申请号: | 202211005317.5 | 申请日: | 2022-08-22 |
| 公开(公告)号: | CN115394373A | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 张强;庄祥;方尹;陈华钧 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/70;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 样本 任务 关系 学习 分子 属性 预测 方法 | ||
1.一种基于样本-任务关系图的元学习分子属性预测方法,其特征在于,包括以下步骤:
步骤1,根据分子样本及对应的任务建立样本-任务关系图,其中,以分子样本和任务均作为图中的节点,分子样本与任务对应的任务标签作为节点之间边的属性;
步骤2,构建包含图表示模型和分类器的预测模型,利用图表示模型提取输入样本-任务关系图中分子样本的节点表示和任务的节点表示,利用分类器对分子样本的节点表示和任务的节点表示的拼接结果进行任务标签预测,以输出标签预测概率;
步骤3,基于LSTM构建辅助任务选择器,针对已知目标任务,利用辅助任务选择器采样已知目标任务的辅助任务;
步骤4,基于LSTM构建目标任务选择器,利用辅助任务并采用目标任务选择器采用同一批次内的采样目标任务;
步骤5,基于同一采样目标任务同时采样额外分子样本以构建两组样本-任务关系图,形成正样本对,基于同一批次内不同采样目标任务采样额外分子样本以构建不同两组样本-任务关系图,形成负样本对,通过最大化正样本对之间的一致性和负样本对之间的一致性来构建对比损失;
步骤6,基于对比损失以及根据标签预测概率构建的分类损失来优化辅助任务选择器、目标任务选择器以及预测模型的参数;
步骤7,利用参数优化的辅助任务选择器和预测模型进行分子属性的预测。
2.根据权利要求1所述的基于样本-任务关系图的元学习分子属性预测方法,其特征在于,所述样本-任务关系图被输入至图表示模型之前,需要经过节点的初始化,其中,分子样本的节点表示初始化为分子样本的初级向量,该初始向量通过分子表示模型对分子样本的表示学习得到,任务的节点表示初始化为随机向量;
所述图表示模型和分子表示模型均为可插拔的基于图神经网络构建的图编码模型,其中,图神经网络包括GCN、GIN、GraphSAGE、MPNN。
3.根据权利要求1所述的基于样本-任务关系图的元学习分子属性预测方法,其特征在于,利用辅助任务选择器采样已知目标任务的辅助任务,包括:
以已知目标任务的向量表示与候选辅助任务的向量表示之间的第一表示相似程度、分子样本在已知目标任务与候选辅助任务上的标签相似程度作为辅助任务选择器的输入,经计算输出候选辅助任务的采样概率,依据采样概率从候选辅助任务中采样辅助任务。
4.根据权利要求3所述的基于样本-任务关系图的元学习分子属性预测方法,其特征在于,所述第一表示相似程度通过计算得到,其中,分别是已知目标任务和候选辅助任务的向量表示,该向量表示随机初始化得到,sim1(·)表示相似度计算方式,优选为余弦相似度计算方式;
所述标签相似程度通过dist(yt,ya)计算得到,其中,yt,ya分别是分子样本相对于已知目标任务与候选辅助任务的任务标签向量,dist(·)表示任务标签向量之间距离的计算方式,优选为欧氏距离计算方式。
5.根据权利要求1所述的基于样本-任务关系图的元学习分子属性预测方法,其特征在于,利用辅助任务并采用目标任务选择器采用同一批次内的采样目标任务,包括:
以预测模型针对分子样本在已知目标任务上的预测损失值、预测模型针对分子样本在辅助任务上的预测损失值、已知目标任务的向量表示与辅助任务的向量表示之间的第二表示相似程度作为目标任务选择器的输入,经计算输出采样目标任务的采样概率,依据采样概率从辅助任务中采样辅助任务作为采样目标任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211005317.5/1.html,转载请声明来源钻瓜专利网。





