[发明专利]一种基于协方差矩阵的主动学习方法有效
申请号: | 202010693215.1 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111860863B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 熊伟丽;周博文;马君霞 | 申请(专利权)人: | 江南大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F17/16 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 刘小莉 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协方差 矩阵 主动 学习方法 | ||
1.一种基于协方差矩阵的主动学习方法,其特征在于:包括:
采集脱丁烷塔生产过程的丁烷浓度值,并将丁烷浓度值作软测量建模样本;
将软测量建模样分为训练集和测试集,其训练集划分为有标签样本集和无标签样本集;
利用有标签样本集建立高斯过程回归模型,并确定模型初参数;
根据无标签样本集,选出构成协方差矩阵行列式值最大的样本:从N个无标签样本选取前m个样本,通过所述高斯过程回归模型确定的模型参数,并计算这m个无标签样本的协方差矩阵行列式值;剩余的无标签样本依次替代m个无标签样本中的第1个样本,替换次数为剩余无标签样本个数,计算替换后的协方差矩阵行列式值;设第a个样本替换第1个样本后,协方差矩阵行列式值最大,则以第a个样本替换第1个无标签样本,其无标签样本集则除去第a个样本;按上述流程依次替换直至使行列式值最大的样本z替换第m个样本,完成m个样本的全部替换,构成协方差矩阵行列式值最大的样本;
重新建立高斯过程回归模型,确定模型参数;
利用测试集对丁烷浓度进行预测。
2.如权利要求1所述的基于协方差矩阵的主动学习方法,其特征在于:所述训练集的有标签样本集和无标签样本集分别为和
其中,nl和nu分别为有标记样本和无标记样本个数,n为辅助变量个数。
3.如权利要求2所述的基于协方差矩阵的主动学习方法,其特征在于:所述高斯过程回归模型采用高斯协方差函数;
其中,高斯协方差函数公式如下:
其中,l为方差尺度,σf2为信号方差,Xi和Xj表示为输入变量,δij表示为噪声标准差,i=j,δij=1否则δij=0。
4.如权利要求3所述的基于协方差矩阵的主动学习方法,其特征在于:所述高斯过程回归模型的超参数为θ={σf2,l2};
其中,最优超参数采用极大似然估计和共轭梯度下降法获得。
5.如权利要求4所述的基于协方差矩阵的主动学习方法,其特征在于:所述高斯过程回归模型的均值和方差通过式(2)得到:
其中,K(X*,X*)为待测样本自身协方差矩阵,K(X,X*)为待测样本与标记样本的协方差矩阵,K(X,X)为标记样本自身协方差矩阵。
6.如权利要求5所述的基于协方差矩阵的主动学习方法,其特征在于:若X*为多个无标签样本的集合,则D(f*|X,y)为无标签样本构成的协方差矩阵,记为cov(f*|X,y)。
7.如权利要求5或6所述的基于协方差矩阵的主动学习方法,其特征在于:无标样本的协方差矩阵由式(2)构建;
其中,其根据行列式的值衡量样本间的相似性。
8.如权利要求7所述的基于协方差矩阵的主动学习方法,其特征在于:所述重新建立高斯过程回归模型,确定模型参数:
对挑选出的m个使协方差矩阵行列式值最大的无标签样本进行人工标记,标记后加入有标签样本集;
更新有标签样本集,重新建立高斯过程回归模型;
重新确定模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010693215.1/1.html,转载请声明来源钻瓜专利网。