[发明专利]一种化学逆向合成路径规划方法及系统在审
| 申请号: | 202210149979.3 | 申请日: | 2022-02-18 |
| 公开(公告)号: | CN114530208A | 公开(公告)日: | 2022-05-24 |
| 发明(设计)人: | 洪思琪;卓汉逵 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G16C20/10 | 分类号: | G16C20/10;G16C20/70;G16C20/30;G16C10/00 |
| 代理公司: | 深圳市创富知识产权代理有限公司 44367 | 代理人: | 高冰 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 化学 逆向 合成 路径 规划 方法 系统 | ||
本发明公开了一种化学逆向合成路径规划方法及系统,该方法包括:收集单步反应数据并生成单步反应训练数据集;构建单步合成预测模型并基于单步反应训练数据集进行训练,得到训练完成的单步合成预测模型;基于蒙特卡洛树搜索学习方法对单步合成预测模型进行博弈学习,判断到指导函数收敛,对化合物进行路径规划。该系统包括:数据收集模块、模型构建模块和搜索学习模块。通过使用本发明,能够进行反应条件的预测且解决多步合成数据缺失带来的指导函数质量不高的问题。本发明作为一种化学逆向合成路径规划方法及系统,可广泛应用于计算机辅助化学合成领域。
技术领域
本发明涉及计算机辅助化学合成领域,尤其涉及一种化学逆向合成路径规划方法及系统。
背景技术
一个化合物的合成路线通常是多种多样的,如何高效率地规划出一条路线,这个问题很大程度上取决于研究人员丰富的化学知识和经验。但是随着化学数据库的规模增大、化学反应的种类增加,单单依靠化学家们丰富的经验和人类大脑能够储存的知识量来应对这个复杂的问题是完全不够的。合成路径规划问题最大的难点在于,对于一个目标化合物潜在的分解方式有很多,多个反应模板可以被应用到同一个目标化合物上,而合成路径通常是多步的,这造成了“组合爆炸”、搜索空间巨大的问题。
发明内容
为了解决上述技术问题,本发明的目的是提供一种化学逆向合成路径规划方法及系统,能够进行反应条件的预测且解决多步合成数据缺失带来的指导函数质量不高的问题。
本发明所采用的第一技术方案是:一种化学逆向合成路径规划方法,包括以下步骤:
收集单步反应数据并生成单步反应训练数据集;
构建单步合成预测模型并基于单步反应训练数据集进行训练,得到训练完成的单步合成预测模型;
基于蒙特卡洛树搜索学习方法对单步合成预测模型进行博弈学习,判断到指导函数收敛,对化合物进行路径规划。
进一步,所述收集单步反应数据并生成单步反应训练数据集这一步骤,其具体包括:
收集单步反应数据并进行模板抽取和化学信息抽取,得到单步反应训练数据集;
所述化学信息包括反应温度、反应压强、催化剂和产物化合物。
进一步,述构建单步合成预测模型并基于单步反应训练数据集进行训练,得到训练完成的单步合成预测模型这一步骤,其具体包括:
基于多分类器构建单步合成预测模型;
基于单步反应训练数据集,以化合物的特征向量为输入,以每个模板预测的概率、预测的化学信息为输出,训练构建单步合成预测模型,得到训练完成的单步合成预测模型。
进一步,所述基于蒙特卡洛树搜索学习方法对单步合成预测模型进行博弈学习,判断到指导函数收敛,对化合物进行路径规划这一步骤,其具体包括:
收集目标化合物数据集,并划分得到训练集、验证集和测试集。
生成指导函数并随机初始化参数;
对于训练集中的每个化合物,基于指导函数指导的蒙特卡洛树搜索进行路径规划,直至最大搜索代价,得到搜索树;
对训练集中形成的每棵搜索树进行经验收集,生成经验数据集并对指导函数进行更新,得到更新后的指导函数;
基于验证集验证更新后的指导函数性能,验证通过得到最佳指导函数;
基于最佳指导函数指导的蒙特卡洛树搜索对化合物进行路径规划。
进一步,所述基于验证集验证更新后的指导函数性能,验证通过得到最佳指导函数这一步骤,其具体包括:
基于更新后的指导函数对验证集中的化合物进行路径规划并统计平均搜索时间和成功率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210149979.3/2.html,转载请声明来源钻瓜专利网。





