[发明专利]一种预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法在审
申请号: | 202210275380.4 | 申请日: | 2022-03-21 |
公开(公告)号: | CN115527623A | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 谢宏彬;刘雨;马芳芳 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/70;G06K9/62;G06F17/18 |
代理公司: | 大连格智知识产权代理有限公司 21238 | 代理人: | 潘小铁;刘琦 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预测 大气 有机 促进 甲磺酸 驱动 粒子 生成 潜力 线性 回归 方法 | ||
1.一种预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法,其特征在于,步骤如下:
(1)数据搜集与计算
从文献中搜集50种有机胺及其气相碱性GB,对其结构进行优化,得到有机胺的最稳定构型,利用输出文件中的热力学参数计算它们与甲磺酸1:1团簇的形成自由能ΔG;
(2)计算有机胺分子的描述符
将有机胺最稳定构型的.log文件转化为.mol文件;根据.mol文件计算50种有机胺的分子描述符平均第一电离势Mi和径向分布函数RDF040s;
(3)模型训练
将有机胺与甲磺酸的1:1团簇的形成自由能ΔG、气相碱性GB、平均第一电离势Mi和径向分布函数RDF040s数据合并;将数据集按3:1的比例随机拆分成训练集和验证集,以有机胺与甲磺酸的1:1团簇的形成自由能ΔG为因变量,以有机胺气相碱性GB,平均第一电离势Mi,径向分布函数RDF040s为自变量,采用逐步多元线性回归的方法,训练线性回归模型,模型见式1;
ΔG=-0.0500GB-123.780Mi-0.189RDF040s+182.222 (1)
(4)模型性能评估
使用训练集计算值-预测值决定系数R2,均方根误差RMSE,表征模型拟合优度;验证集的R2,RMSE表征模型预测能力;使用训练集的去一法内部交叉验证系数Q2LOO表征模型稳健性;
(5)应用域表征
采用Williams图对该模型进行应用域表征,即采用50种有机胺的杠杆值h对标准残差δ作图,h,δ和预警值h*计算方法如下:
其中,yi和分别是第i个数据点的计算值和模型预测值,n是数据集中数据的个数,A是模型中涉及的描述符的个数,hi、xi分别表示第i个数据的杠杆值和描述符矢量,X为描述符矩阵,XT为描述符矩阵的转置,ntra为训练集中数据的个数,|δ|3,视为离群点,|δ|3,hih*表示数据处于应用域内,训练集中有机胺hih*表示该分子的结构出现次数较少,对模型的建立有影响;验证集中有机胺的hih*,|δ|3,表示该物质的预测结果是模型的外推,说明模型也适用于该物质。
2.根据权利要求1所述的方法,其特征在于,所述50种有机胺的种类至少包括脂肪胺、芳香胺、酰胺、哌嗪和氨基酸。
3.根据权利要求1所述的方法,其特征在于,步骤(1)中通过在GAUSSIAN 09和ORCA 4.0程序中分别利用密度泛函DFT方法和从头算ab initio方法优化有机胺的分子结构;步骤(2)中.mol文件是通过Open Babel 2.3.2.2软件将GAUSSIAN 09的输出.log文件转化为.mol文件得到的。
4.根据权利要求1所述的方法,其特征在于,步骤(2)中通过将.mol文件输入Dragon6.0.0软件中进行计算。
5.根据权利要求1所述的方法,其特征在于,所述h*=0.3243。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210275380.4/1.html,转载请声明来源钻瓜专利网。