[发明专利]一种离子液体分子结构的获取方法、系统、设备及介质在审
申请号: | 202310342300.7 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116306003A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 刘向阳;褚健淳;何茂刚 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G16C20/10;G16C20/30;G16C20/50;G06N3/04;G06N3/0455;G06N3/08;G06F111/04 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李鹏威 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 离子 液体 分子结构 获取 方法 系统 设备 介质 | ||
本发明属于计算机辅助分子设计技术领域,公开了一种离子液体分子结构的获取方法、系统、设备及介质,所述离子液体分子结构的获取方法包括以下步骤:步骤1,获取目标离子液体的设计目标;其中,所述设计目标为一种或多种性质的权重函数;步骤2,基于步骤1获取的所述设计目标,利用预先训练好的离子液体分子结构生成模型进行设计,获得目标离子液体的分子结构。本发明提供的离子液体分子结构的获取方法,可应用于小规模稀疏数据集的离子液体设计,解决了现有技术无法应用于离子液体的小规模稀疏数据集,以及生成准确性较低的技术问题。
技术领域
本发明属于计算机辅助分子设计技术领域,特别涉及一种离子液体分子结构的获取方法、系统、设备及介质。
背景技术
离子液体由于其对气体的高溶解度、环境友好性、高热、电及化学稳定性、独特的电化学性能,在气体分离、催化、可充电电池、储能材料等方面获得了广泛的关注。美国国家标准与技术研究院开发的离子液体数据库(ILThermo)对离子液体的性质数据收录比较完整,共收录了由约200种阴离子和约750种阳离子构成的约2500种离子液体;然而,潜在的离子液体有1018种,针对特定应用所关注的性质,不太可能通过实验对所有离子液体的性质进行测量,以筛选出最理想的离子液体。
针对上述问题,潜在的解决方案是采用基于大数据的分子设计模型,通过足够的分子结构与其性质训练后,分子设计模型可以快速地根据目标性质在数据集中寻找或设计出不在数据集内的相应分子;其中,在现有众多大数据分子设计模型中,变分自编码器类模型因为具有优秀的可解释性与生成能力而被广泛采用。
进一步解释性的,使用分子设计模型根据目标性质在数据集中寻找相应分子时(示例性的,如公开号为CN114300065A的中国发明申请公开的技术方案),局限性主要有以下两个具体表现,包括:
(1)该类型的模型的输出结果必然是数据集中已经存在的分子结构,无法提供数据集外的分子;
(2)该类型的模型的工作方式是寻找与已知的优秀分子结构相似的分子,因此其输出的分子的性质也与已知的优秀分子相似,数据集中非常优秀但与已知的优秀分子结构差异较大的分子不会成为模型搜索结果;
另外,用于生成分子时,变分自编码器类模型一般需要通过5万个以上分子进行训练后才具有生成能力,且要求所有用于训练的分子都具有关注的性质信息;离子液体中离子间距远大于离子内各化学键的键长,且离子液体的数据集过小、具有严重的稀疏性,传统变分自编码器模型无法应用于离子液体分子设计。现有的数据增强方法,如Moret等人提出的多SMILES描述法和迁移学习,都被证实无法提升变分自编码器对离子液体的设计性能。
综上,将传统变分自编码器应用于离子液体设计的局限性主要有以下两个具体表现,包括:
(1)传统变分自编码器首先被应用于图片领域,其生成的图片特点是模糊;应用于分子描述符如SMILES(Simplified Molecular Input Line Entry System,简化分子线性输入规范)时,由于SMILES有严格的语法规则而导致的非鲁棒性,使传统变分自编码器的输出大部分都无法被解读为分子结构;
(2)变分自编码器与预测模型同时训练时,预测模型的损失函数反向传播的梯度会作用于变分自编码器,使变分自编码器对分子的编码具有倾向性,即:倾向于将代表分子的高维空间坐标随其性质有规则地排布,使优化算法可以简单地在高维空间中朝着一个方向前进并将采样的坐标解码为设计结果,但是由于实验数据较少,无法同时训练变分自编码器与预测模型;若将变分自编码器与预测模型分开训练,分子的高维空间坐标与其性质之间很难存在梯度关系,使优化算法难以按照梯度寻找最优解。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310342300.7/2.html,转载请声明来源钻瓜专利网。