[发明专利]一种基于样本-任务关系图的元学习分子属性预测方法在审
| 申请号: | 202211005317.5 | 申请日: | 2022-08-22 |
| 公开(公告)号: | CN115394373A | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 张强;庄祥;方尹;陈华钧 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/70;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 样本 任务 关系 学习 分子 属性 预测 方法 | ||
本发明公开了一种基于样本‑任务关系图的元学习分子属性预测方法,基于构建的样本‑任务关系图显示地建立样本与任务属性之间的关系,该样本‑任务关系图是目前率先利用样本与任务之间的图结构指导元学习分子属性预测的方法,设计的辅助任务选择器能够顾针对不同的已知目标任务选择辅助任务,以便更好地利用辅助任务增强预测模型对目标任务的预测能力。设计的目标任务选择器能够选择预测模型训练时同一批次内的采样目标任务,作为对比损失函数的负样本挖掘技术。针对采样目标任务的对比损失函数,以便预测模型能够更好地区分不同采样目标任务的同时最大化同一采样目标任务的一致性。
技术领域
本发明属于分子属性预测领域,具体涉及一种基于样本-任务关系图的元学习分子属性预测方法。
背景技术
深度学习方法需要利用大量的带标签数据进行训练,然而对数据打标签的代价是昂贵的,尤其在分子性质预测任务中,分子的性质需要在实验室中进行实验测定,这一过程不仅耗费时间,同时也会耗费金钱成本,带标签样本少、对数据进行标注的问题限制了深度学习在实际场景中的引用。因此,如何能够使得深度学习模型在带标签样本数量较少的情况下获得较好的性能是一个非常重要的问题,元学习方法的提出就是为了解决带标签数据稀少的小样本问题。
小样本分子性质预测的问题与广泛研究的小样本图片分类问题不同,通常来讲,在图片分类时,一张图片只有一个标签,然而,对于分子来说,同一个分子同时具备不同的属性,即同时具备多个属性标签,例如与不同蛋白的结合程度、吸收性、毒性、溶解性等。分子的一些属性在实验室中易测得,有些属性在实验室中测得的代价较高,因此,可以利用分子易测得的分子性质推测难以测得的分子性质。传统的小样本学习方法在图片分类任务上取得了较好的效果,但在应用于小样本分子属性预测时具有明显的缺点:在预测目标属性时无法考虑分子同时具有的其他属性。
公布号为CN112164428A的专利申请公开了一种基于深度学习的药物小分子性质预测方法,该方法基于构建好的训练样本采用监督学习的方式来构建用于药物小分子性质的模型,该过程需要更多的带标签的样本数据,但是在实际应用中,样本数据的标签难以测得,这样该方法并不适用。
公布号为CN113990408 A的专利申请公开了一种基于化学元素知识图谱的分子图对比学习方法,该方法通过构建的正负样本对的对比学习来构建分子表示,但是仍然需要分子性质标签来优化非线性分类器,基于该分子表示和优化非线性分类器可以实现分子性质预测。但是在实际应用中,样本数据的标签难以测得,这样该方法并不适用。
发明内容
鉴于上述,本发明的是提供一种基于样本-任务关系图的元学习分子属性预测方法,通过构建样本-任务关系图,在预测分子的目标属性时考虑分子同时具备的其他已知属性,提升元学习分子属性预测的准确性。
为实现以上发明目的,本发明提供的一种基于样本-任务关系图的元学习分子属性预测方法,包括以下步骤:
步骤1,根据分子样本及对应的任务建立样本-任务关系图,其中,以分子样本和任务均作为图中的节点,分子样本与任务对应的任务标签作为节点之间边的属性;
步骤2,构建包含图表示模型和分类器的预测模型,利用图表示模型提取输入样本-任务关系图中分子样本的节点表示和任务的节点表示,利用分类器对分子样本的节点表示和任务的节点表示的拼接结果进行任务标签预测,以输出标签预测概率;
步骤3,基于LSTM构建辅助任务选择器,针对已知目标任务,利用辅助任务选择器采样已知目标任务的辅助任务;
步骤4,基于LSTM构建目标任务选择器,利用辅助任务并采用目标任务选择器采用同一批次内的采样目标任务;
步骤5,基于同一采样目标任务同时采样额外分子样本以构建两组样本-任务关系图,形成正样本对,基于同一批次内不同采样目标任务采样额外分子样本以构建不同两组样本-任务关系图,形成负样本对,通过最大化正样本对之间的一致性和负样本对之间的一致性来构建对比损失;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211005317.5/2.html,转载请声明来源钻瓜专利网。





