[发明专利]基于深度森林的有机化学偶联反应产率预测与分析方法在审
| 申请号: | 202110761921.X | 申请日: | 2021-07-06 |
| 公开(公告)号: | CN113380345A | 公开(公告)日: | 2021-09-10 |
| 发明(设计)人: | 彭李超;杨晓慧;穆雪纯;董晶;邹雪艳;孙磊 | 申请(专利权)人: | 河南大学 |
| 主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/10;G06K9/62 |
| 代理公司: | 郑州立格知识产权代理有限公司 41126 | 代理人: | 崔卫琴 |
| 地址: | 475001 河*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 森林 有机化学 反应 预测 分析 方法 | ||
本发明公开了一种基于深度森林的有机化学偶联反应产率预测与分析方法,包括特征描述符的计算、模型的搭建、产率的智能回归和分类预测,具体实现步骤如下:1)利用化学软件计算每种偶联反应组分的特征描述符,将其转换为一维数据;2)搭建深度森林模型对特征描述符进行训练,通过自我调节参数达到最佳预测效果,该方法结合了深度学习的特征学习和集成学习的思想,实现了化学反应的高效预测;3)使用训练好的模型对产率进行智能回归和分类预测,并对预测结果分析;计算一维特征描述符的重要性,分析特征描述符对产率影响的强弱,在生产试验中为用户提供更可靠的决策信息。本发明能够在节约成本的基础上辅助化学家快速对产率预测。
技术领域
本发明属于基于模式识别和人工智能的有机合成领域,具体涉及基于深度森林的有机化学偶联反应产率预测与分析方法。
背景技术
偶联反应(Coupling Reaction)是由两个有机化学单位(Molecules)进行某种化学反应而得到一个有机分子的过程,包括交叉偶联反应和自身偶联反应。其中,交叉偶联反应具有效率高、反应条件温和等优点,常被用来有机合成。随着原子和分子被更加有效地操控和运用,过去难以合成甚至无法合成的物质已经被轻而易举地创造出来。偶联反应还主要用于天然产物合成、材料科学、农药化学和配体合成等领域。因此,提高偶联反应的产率能够推动生产生活。为了在减少消耗的前提下实现偶联反应产物的有效制备,需要更加准确地预测偶联反应的产率,探究影响偶联反应产率的重要因素,为生产试验提供更可靠的决策信息。
在过去的几十年中,偶联反应发展迅速。其中,1903年,Ullmann课题组通过对芳基卤化物与胺的偶联反应实验,实现了C-N键的构建;1972年,Richard F.Heck发现了钯催化剂能够在较温和的条件下实现碳原子之间的连接;1983年,T.Migita等人报道了第一个钯催化生成C(sp2)-N键的反应;1995年,Stephen L.Buchwald和John F.Hartwig两个研究团队几乎同时发现了没有有机锡化合物参与的钯催化芳基溴与胺的偶联反应;2010年,Richard F.Heck、Ei-ichiNegishi和Akira Suzuki三位科学家因发展出“有机合成中的钯催化的交叉偶联方法”被授予诺贝尔化学奖。
目前,常见的钯催化剂应用非常广泛,虽然这些催化剂都已商业化,但对于大规模生产的反应,仍需要降低制备成本。传统的化学实验方法存在反应成本高、反应周期长、实验过程繁琐、实验数据未能得到合理利用等弊端,在通过Buchwald-Hartwig偶联反应实现芳胺制备时,存在Pd金属价格昂贵且具有毒性、反应过程中可能生成例如芳烃类化合物等副产品,导致Buchwald-Hartwig偶联反应产率较低。为解决以上这些问题,化学家们希望找到科学智能地预测有机化学合成的方法。
近年来,随着机器学习算法的蓬勃发展,考虑到化学结构和反应性的多维性,为了在节约资源的基础上提高偶联反应的产率,越来越多的专家人士将机器学习算法应用于有机合成和化学性能预测。2018年,Doyle等人实现了基于随机森林算法对Buchwald-Hartwig偶联反应产率的高精度预测。这也证明机器学习方法可以使用通过高通量实验获得的数据,对多维化学空间反应的合成进行预测。现急需一种有机化学偶联反应产率预测与分析方法,能够提取特征描述符,将偶联反应转换为一维数据,结合机器学习方法利用计算机快速挖掘化学实验中复杂反应条件之间的相关性,减少人力资源和化学资源的消耗,帮助化学家做出合理分析预测,促进有机化学合成的研发。
发明内容
为了解决现有技术的不足,本发明旨在提供一种基于深度森林的有机化学偶联反应产率预测与分析方法,通过自我调节参数能够以较高的准确率快速达到偶联反应产率的最佳预测效果,并挖掘影响产率的重要特征,在节约成本的基础上辅助化学家对产率预测。
为了实现上述目的,本发明采用的技术方案为:
基于深度森林的有机化学偶联反应产率预测与分析方法,包括特征描述符的计算、模型的搭建、产率的智能回归和分类预测;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110761921.X/2.html,转载请声明来源钻瓜专利网。





