[发明专利]一种红外光谱数据PLS建模方法有效

专利信息
申请号: 201410362602.1 申请日: 2014-07-28
公开(公告)号: CN104091089A 公开(公告)日: 2014-10-08
发明(设计)人: 陈孝敬 申请(专利权)人: 温州大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 长沙正奇专利事务所有限责任公司 43113 代理人: 马强
地址: 32503*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种红外光谱数据PLS建模方法,结合各个间隔区间的PLS模型的误差和误差之间的相关性来确定各个间隔区间的PLS模型的权系数,从而能使所得的融合PLS模型具有最小的误差。本发明的方法可以最好的利用各个间隔区间的光谱信息,简便、可视化、运算量小,可以很快的找到特征波长区间;本方明中的权系数的确定方法由于同时考虑到了各个参与融合的模型的误差以及误差之间的相关性,能保证融合之后的模型具有最小的误差。
搜索关键词: 一种 红外 光谱 数据 pls 建模 方法
【主权项】:
一种红外光谱数据PLS建模方法,其特征在于,包括以下步骤:1)设置最大间隔区间数max_int_no、最大潜变量数max_lv_no、交叉法的重数k1和k2;其中,k1、k2均不小于2;2)按照步骤2.1)和步骤2.2)计算间隔区间数为int_no时,对应的融合PLS模型的交叉验证误差,其中1≤int_no≤max_int_no:2.1)将红外光谱样本集数据中的光谱矩阵X平均分为int_no个间隔区间Xi:每个间隔区间的列数[]表示取整;第i个间隔区间Xi对应光谱矩阵X的第[(i‑1)×l+1]~(i×l)列的数据;1≤i≤int_no;2.2)按照步骤2.2.1)~步骤2.2.5)计算潜变量数为lv_no时,融合PLS模型的其中1≤lv_no≤max_lv_no:2.2.1)用k1重交叉法计算间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的交叉验证误差其中y表示红外光谱样本集数据中的因变量矩阵的实际值,表示第i个间隔区间对应的潜变量数为lv_no的PLS模型根据k1重交叉法得到的因变量矩阵的预测值,ei是相应的预测残差矩阵,n是红外光谱样本集数据的样品数;2.2.2)计算间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的预测残差矩阵之间的相关性其中,<mrow><mi>cov</mi><mrow><mo>(</mo><msub><mi>e</mi><mi>i</mi></msub><mo>,</mo><msub><mi>e</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><mo>&lt;</mo><msub><mi>e</mi><mi>i</mi></msub><mo>,</mo><msub><mi>e</mi><mi>j</mi></msub><mo>></mo><mo>,</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>int</mi><mo>_</mo><mi>no</mi><mo>;</mo></mrow>2.2.3)通过非线性优化的方法计算下式:<mrow><mi>f</mi><mo>=</mo><mi>min</mi><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow></munderover><msubsup><mi>&omega;</mi><mi>i</mi><mn>2</mn></msubsup><msup><mi>S</mi><mn>2</mn></msup><mrow><mo>(</mo><msub><mi>e</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mn>2</mn><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>p</mi><mo>></mo><mi>i</mi></mrow><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow></munderover><msub><mi>&omega;</mi><mi>i</mi></msub><msub><mi>&omega;</mi><mi>p</mi></msub><msub><mi>r</mi><mi>ip</mi></msub><mi>S</mi><mrow><mo>(</mo><msub><mi>e</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>S</mi><mrow><mo>(</mo><msub><mi>e</mi><mi>p</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mfenced open='{' close=''><mtable><mtr><mtd><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow></munderover><msub><mi>&omega;</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn></mtd></mtr><mtr><mtd><mn>0</mn><mo>&le;</mo><msub><mi>&omega;</mi><mi>i</mi></msub><mo>&le;</mo><mn>1</mn></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>得到间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的组合系数ω=[ω1,…,ωint_no]':2.2.4)用k2重交叉法计算间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的预测残差矩阵其中表示第i个间隔区间对应的潜变量数为lv_no的PLS模型根据k2重交叉法得到的因变量矩阵的预测值,计算<mrow><msubsup><mover><mi>f</mi><mo>^</mo></mover><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow><mrow><mi>lv</mi><mo>_</mo><mi>no</mi></mrow></msubsup><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow></munderover><msubsup><mi>&omega;</mi><mi>i</mi><mn>2</mn></msubsup><msup><mi>S</mi><mn>2</mn></msup><mrow><mo>(</mo><msub><mi>e</mi><mrow><mn>2</mn><mi>i</mi></mrow></msub><mo>)</mo></mrow><mo>+</mo><mn>2</mn><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>p</mi><mo>></mo><mi>i</mi></mrow><mrow><mi>int</mi><mo>_</mo><mi>no</mi></mrow></munderover><msub><mi>&omega;</mi><mi>i</mi></msub><msub><mi>&omega;</mi><mi>p</mi></msub><msub><mi>r</mi><mi>ip</mi></msub><mi>S</mi><mrow><mo>(</mo><msub><mi>e</mi><mrow><mn>2</mn><mi>i</mi></mrow></msub><mo>)</mo></mrow><mi>S</mi><mrow><mo>(</mo><msub><mi>e</mi><mrow><mn>2</mn><mi>p</mi></mrow></msub><mo>)</mo></mrow><mo>;</mo></mrow>2.2.5)选出最小的作为间隔区间数为int_no时的融合PLS模型的交叉验证误差,记为3)选出所有间隔区间数下最小的该最小的对应的间隔区间数int_bt、潜变量数lv_bt和组合系数ω_bt作为最优的模型参数;4)根据最优的模型参数构造融合PLS模型:将光谱矩阵X平均分为int_bt个间隔区间,融合PLS模型如下:<mrow><msup><mi>y</mi><mo>*</mo></msup><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>g</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>int</mi><mo>_</mo><mi>bt</mi></mrow></munderover><mi>&omega;</mi><mo>_</mo><msub><mi>bt</mi><mi>g</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>g</mi></msub><mo>&times;</mo><msub><mi>b</mi><mi>g</mi></msub><mo>+</mo><msub><mi>c</mi><mi>g</mi></msub><mo>)</mo></mrow></mrow>其中,ω_btg是ω_bt的第g个分量,y*是融合PLS模型对样品的因变量的预测值;bg、cg分别是间隔区间Xg和因变量矩阵Y对应潜变量数为lv_bt时的偏最小回归系数和截距;xg是第g个间隔区间对应的红外光谱数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410362602.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top