[发明专利]基于ChemCNet的有机合成智能分析方法及系统在审

专利信息
申请号: 202211385153.3 申请日: 2022-11-07
公开(公告)号: CN115691686A 公开(公告)日: 2023-02-03
发明(设计)人: 彭李超;王恒哲;杨晓慧;郭艳慧;李子欣;余亚萍 申请(专利权)人: 河南大学
主分类号: G16C10/00 分类号: G16C10/00;G16C20/10;G16C20/70;G06N3/08;G06N3/0464;G06N3/048
代理公司: 郑州芝麻知识产权代理事务所(普通合伙) 41173 代理人: 张丹丹
地址: 450046 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 chemcnet 有机合成 智能 分析 方法 系统
【说明书】:

发明涉及人工智能的有机合成技术领域,具体涉及一种基于ChemCNet的有机合成智能分析方法及系统;该方法包括:1)特征描述符的计算,根据软件将化学反应条件转化为特征描述符;2)模型的建立,构建注意力驱动,并结合深度学习和集成提升树CatBoost的ChemCNet模型,对特征描述符进行再表示学习、产率进行智能预测,对产率和反应条件内在关系进行分析;3)使用特征重要性和SHAP值对ChemCNet模型及其预测结果进行可视化分析。该方法能够降低数据冗余性,实现化学反应产率的精准预测;符合绿色化学,智慧化学理念,在节约资源的基础上实现对产率的精准预测,并智能分析反应条件与产率之间的内在关系。

技术领域

本发明涉及人工智能的有机合成技术领域,具体涉及一种基于ChemCNet的有机合成智能分析方法及系统。

背景技术

芳胺是化学中的基础产物和合成砌块,许多活性药物的成分都含有芳胺,它是药物化学领域有价值的靶点。芳基C-N键的形成反应由此在医药领域得到日益频繁的应用。C(sp2)-N键在药物发现中普遍存在,虽然经典的形成该键的策略,例如芳香族亲核取代反应(SNAr反应)、柯提斯重排反应(Curtius rearrangement)和铜催化偶联反应仍然是重要的转变,但它们有限的范围限制了广泛的适用性。然而,钯催化的Buchwald-Hartwig偶联反应极大地改变了这一方向,该反应是目前产生C-N键的一种高效且通用的方法,而且该反应进一步的优化和开发,在药物研发及大规模生产中极具应用潜力。2004年,Robinson,G.E等人基于钯催化Buchwald-Hartwig偶联合成策略合成了用于治疗抑郁和焦虑症的有效的口服活性5-HT1B受体拮抗剂ZM549865;2010年,美国科学家理查德·赫克,日本科学家根岸英一和铃木章三位科学家因在“钯催化的交叉偶联反应”领域的杰出贡献获得诺贝尔化学奖。他们的工作广泛应用于医药领域,比如制备了对抗药性细菌起作用的药物抗生素,DNA测序必不可少的荧光标记;2016年有报道称在2014年发表的药物化学论文中至少有10%使用过一次Buchwald-Hartwig偶联反应。诺华生物医学研究所的研究团队在2016年研究发现,Buchwald-Hartwig偶联反应是这40年间药物化学家常用的反应类型,由于有大量的含氮生物活性化合物,N-芳基化反应在制药行业中的整合是迅速的,合成程序的简单性和所获得的产品的多功能性也简化了用于药物化学的化合物库的创建,这些都表明了此反应在制药研发中的重要性。

然而,该反应的反应路线较为复杂,耗时长,成本高,传统的化学实验需要大量的人工试错,消耗大量的人力物力财力,而且在通过Buchwald-Hartwig偶联反应实现芳胺制备时,Pd金属价格昂贵且具有毒性、反应过程中可能生成例如芳烃类化合物等副产品,不仅危害性较大而且会导致Buchwald-Hartwig偶联反应产率较低。因此利用人工智能算法,精准预测反应产率,探究反应条件与反应产率之间的内部关系,提高生产效率,节约生产成本,简化特殊复杂材料的大规模制造是一项十分有意义的工作。

随着大数据技术的快速发展,化学学科研究正在向基于数据的科学发现范式转变。研究人员借助计算机技术将化学数据进行一定形式的计算、编码转换成计算机可读的数据形式,即描述符。人工智能算法擅于挖掘化学反应实验中产生的大量实验数据的内部潜在信息,帮助化学家做出合理的预测和分析,大大提高化学研发效率,带动传统化学研究方式的转型升级。2018年,Ahneman等人报道了随机森林对Buchwald-Hartwig偶联反应的反应产率的预测,这是机器学习方法在多维化学空间预测领域的先进研究。2021年YananZhao等人使用二维DCNN对反应产率进行预测。然而,Ahneman等人使用原始数据作为模型输入数据,数据纬度高,冗余性大,计算代价大;且采用随机森林作为预测模型,缺少深度学习的特征学习思想,缺乏对深层特征的有效挖掘;Yanan Zhao等人也是采用原始数据,且网络层数多,节点多,计算相对复杂,另外全连接层容易过拟合。因此上述方法均具有不同程度的缺点,不能精准的挖掘到化学实验中反应条件与反应产率间的相关性,造成人力资源和实验资源的浪费。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211385153.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top