[发明专利]一种基于结合岭回归和递归特征消除的定量分析方法有效
申请号: | 202010135378.8 | 申请日: | 2020-03-02 |
公开(公告)号: | CN113340874B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 孙兰香;王国栋;李洋;王金池;丛智博 | 申请(专利权)人: | 中国科学院沈阳自动化研究所 |
主分类号: | G01N21/71 | 分类号: | G01N21/71 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 许宗富 |
地址: | 110016 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结合 回归 递归 特征 消除 定量分析 方法 | ||
1.一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,获取样品原始光谱数据作为输入,通过结合岭回归和递归特征消除算法筛选特征谱线得到特征子集,评价筛选出的特征子集选择最优特征子集,得到最优标定模型对材料进行元素浓度分析;具体包括:
步骤1:获取样品的光谱数据,确定波长范围;
步骤2:对光谱数据进行全谱和归一化;
步骤3:将光谱数据分为训练集和验证集;
步骤:4:对训练集数据的每一维进行标准化,并记录标准化过程中的均值和方差;
步骤5:以标准化后的训练集光谱数据作为输入,对应已知的标准样品浓度作为输出,训练标定岭回归模型;
步骤6:记录岭回归标定模型的模型系数绝对值;
步骤7:根据得到的系数绝对值大小对光谱特征进行排序,并移除最小系数绝对值对应的光谱特征获取新的特征子集;
步骤8:确定评价模型,以得到的新特征子集作为评价模型输入,进行留一验证并记录训练集数据的每个元素的留一交叉验证的均方根误差RMSECV;
步骤9:重复步骤4~步骤8,直至新的特征子集中的特征个数全部删减完成,根据每次迭代过程中的RMSECV结果确定最优的特征子集和对应最优的元素浓度标定模型;
步骤10:以验证集数据作为最优元素浓度标定模型的输入,得到模型输出的验证集数据每个元素的均方根误差RMSEP,对比已知的标准样品浓度后可见其为最优标定模型。
2.根据权利要求1所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,所述样品为标准样品,获取样品原始光谱数据为宽谱段光谱的LIBS光谱数据,通过实验测量获得。
3.根据权利要求1所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,所述标准样品内元素浓度预先测定。
4.根据权利要求1所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,训练集和验证集为随机抽取,训练集样品量占所有数据的80%-90%,测试集占10%-20%。
5.根据权利要求1所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,所述标准化是对光谱数据的每一维数据减去该维数据的均值并除以该维数据方差。
6.根据权利要求1所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,所述岭回归模型惩罚系数根据标定不同的元素,对应不同惩罚系数范围介于0.001~5之间。
7.根据权利要求1所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,所述选择最优特征子集的评价模型为多变量回归模型,包括偏最小二乘回归PLS模型、支持向量回归SVR模型、岭回归Ridge模型。
8.根据权利要求1所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,所述留一验证包括:获得新的特征子集在训练集上采用N-1样品建模,剩余一个样品验证并记录训练集数据的每个元素的留一交叉验证的均方根误差RMSECV,重复N次后记录所有样品的RMSECV,根据RMSECV的值判断特征子集的优劣。
9.根据权利要求1或8所述的一种基于结合岭回归和递归特征消除的定量分析方法,其特征在于,RMSECV的值最小所对应的特征子集为最优,对应的PLS标定模型为最优元素浓度标定模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳自动化研究所,未经中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010135378.8/1.html,转载请声明来源钻瓜专利网。