[发明专利]一种红外光谱数据PLS建模方法有效
申请号: | 201410362602.1 | 申请日: | 2014-07-28 |
公开(公告)号: | CN104091089A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 陈孝敬 | 申请(专利权)人: | 温州大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 马强 |
地址: | 32503*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种红外光谱数据PLS建模方法,结合各个间隔区间的PLS模型的误差和误差之间的相关性来确定各个间隔区间的PLS模型的权系数,从而能使所得的融合PLS模型具有最小的误差。本发明的方法可以最好的利用各个间隔区间的光谱信息,简便、可视化、运算量小,可以很快的找到特征波长区间;本方明中的权系数的确定方法由于同时考虑到了各个参与融合的模型的误差以及误差之间的相关性,能保证融合之后的模型具有最小的误差。 | ||
搜索关键词: | 一种 红外 光谱 数据 pls 建模 方法 | ||
【主权项】:
一种红外光谱数据PLS建模方法,其特征在于,包括以下步骤:1)设置最大间隔区间数max_int_no、最大潜变量数max_lv_no、交叉法的重数k1和k2;其中,k1、k2均不小于2;2)按照步骤2.1)和步骤2.2)计算间隔区间数为int_no时,对应的融合PLS模型的交叉验证误差,其中1≤int_no≤max_int_no:2.1)将红外光谱样本集数据中的光谱矩阵X平均分为int_no个间隔区间Xi:每个间隔区间的列数
[]表示取整;第i个间隔区间Xi对应光谱矩阵X的第[(i‑1)×l+1]~(i×l)列的数据;1≤i≤int_no;2.2)按照步骤2.2.1)~步骤2.2.5)计算潜变量数为lv_no时,融合PLS模型的
其中1≤lv_no≤max_lv_no:2.2.1)用k1重交叉法计算间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的交叉验证误差
其中
y表示红外光谱样本集数据中的因变量矩阵的实际值,
表示第i个间隔区间对应的潜变量数为lv_no的PLS模型根据k1重交叉法得到的因变量矩阵的预测值,ei是相应的预测残差矩阵,n是红外光谱样本集数据的样品数;2.2.2)计算间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的预测残差矩阵之间的相关性
其中,![]()
2.2.3)通过非线性优化的方法计算下式:![]()
![]()
得到间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的组合系数ω=[ω1,…,ωint_no]':2.2.4)用k2重交叉法计算间隔数为int_no,潜变量数为lv_no时,各个间隔区间对应的PLS模型的预测残差矩阵
其中
表示第i个间隔区间对应的潜变量数为lv_no的PLS模型根据k2重交叉法得到的因变量矩阵的预测值,计算![]()
![]()
2.2.5)选出最小的
作为间隔区间数为int_no时的融合PLS模型的交叉验证误差,记为
3)选出所有间隔区间数下最小的
该最小的
对应的间隔区间数int_bt、潜变量数lv_bt和组合系数ω_bt作为最优的模型参数;4)根据最优的模型参数构造融合PLS模型:将光谱矩阵X平均分为int_bt个间隔区间,融合PLS模型如下:![]()
其中,ω_btg是ω_bt的第g个分量,y*是融合PLS模型对样品的因变量的预测值;bg、cg分别是间隔区间Xg和因变量矩阵Y对应潜变量数为lv_bt时的偏最小回归系数和截距;xg是第g个间隔区间对应的红外光谱数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410362602.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置