[发明专利]一种半监督集成即时学习工业混炼胶门尼粘度软测量方法有效

专利信息
申请号: 202110458052.3 申请日: 2021-04-27
公开(公告)号: CN113158473B 公开(公告)日: 2022-03-15
发明(设计)人: 金怀平;张燕 申请(专利权)人: 昆明理工大学
主分类号: G06F30/20 分类号: G06F30/20
代理公司: 昆明科众知识产权代理事务所(普通合伙) 53218 代理人: 蒋晗
地址: 650500 云南*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 监督 集成 即时 学习 工业 混炼 胶门尼 粘度 测量方法
【权利要求书】:

1.一种基于半监督集成即时学习的工业混炼胶门尼粘度软测量方法,其特征在于,包括以下步骤:

(1)采集工业混炼胶过程中的数据D,其中D包括同时包含辅助变量和预测输出变量的有标签数据L∈RK×J,以及只包含辅助变量的无标签数据U∈RP×Q,其中,K和J分别表示有标签数据的样本个数和变量个数,P和Q分别表示无标签数据的样本个数和变量个数;

(2)对所有样本进行归一化处理,并将处理后的有标签样本分为训练集Dtrain和测试集Dtest,无标签数据样本作为未标记数据集Dunlabel

(3)针对工业混炼胶过程中呈现出来的非线性,选择高斯过程回归模型作为基模型;

(4)根据相似度准则从Dunlabel中选取合适的未标记样本,以高斯过程回归为基模型,结合即时学习方法,选择合适的伪标记样本;

(5)将选取的伪标记样本加入到训练集Dtrain中,以扩充样本训练集;

(6)通过扩充后的训练集构建多样性的JITGPR子模型,采用有限混合机制对子模型的预测输出进行集成,最终得到门尼粘度的预测输出和方差;

所述步骤(4)中的获取伪标记样本的具体过程为:

①未标记样本选择:采用皮尔逊系数相似度,从无标签数据U∈RP×Q中选择与查询样本最相似的M个未标记样本;

皮尔逊系数相似度:

其中,n是样本的数量,xi和yi代表采样点,μx和μy分别代表样本的均值;

②伪标记样本选择:以高斯过程回归为基模型,结合即时学习方法,建立多样性的JITGPR子模型,从M个未标记样本中取前m个未标记样本进行预测,对预测结果的方差进行FMM自适应集成排序,选择置信度最高的n个未标记样本的预测值作为伪标记样本,将其加入Dtrain中来扩充样本训练集,同时预测完成之后将所选择的n个未标记样本在M个未标记样本中剔除,继续在新的未标记样本集M'中选择前m个未标记进行预测,重复以上步骤直到达到预设的次数;

多样性JITGPR子模型的构建:通过欧氏距离相似度、Cosine相似度、协方差加权距离相似度和皮尔逊系数相似度4种不同的相似度度量方法来构建4种不同的JITGPR子模型;

伪标记置信度评估:对选中的m个未标记样本来说,通过4种不同的相似度构建4种JITGPR子模型,通过FMM集成方法对预测方差进行排序,最后将方差最小的两个未标记所对应的预测值视为置信度最高的伪标记样本;

其中,利用有限混合机制FMM集成方法的描述如下:

对新的查询样本xnew,根据第k个JITGPR子模型得到第k个目标变量的预测输出yk,new的预测分布,并且yk,new符合高斯分布,其表示如下:

式中,和Var(yk,new)分别表示yk,new的预测均值和方差;

假设目标变量y1,new,…,yk,new,…,yK,new的各个输出是整体输出ynew的独立实现,即ynew是由y1,new,…,yk,new,…,yK,new的有限混合分布引起的;因此,通过使用有限混合机制FMM并且融合所有的局部预测输出来估计目标变量的最终预测均值和方差:

式中,和分别表示第k个JITGPR子模型的预测输出和方差;ωk表示混合权重,其应该满足如下条件:

由于预测输出的置信度可以由预测的不确定度来有效的表示,因此假设混合权重ωk与各个JITGPR子模型的预测方差成反比;因此ωk,new可以计算如下:

式中,p是一个调节参数;

所述步骤(6)中的多样性JITGPR子模型的具体构建方式如下:

通过欧氏距离相似度、Cosine相似度、协方差加权距离相似度和皮尔逊系数相似度4种不同的相似度度量方法来构建4种不同的JITGPR子模型;

欧氏距离相似度:

Cosine相似度:

其中,σcos表示的标准差;

协方差加权距离相似度:

式中,H表示加权矩阵,X和y分别表示输入矩阵和输出矩阵;

皮尔逊系数相似度:

其中,n是样本的数量,xi和yi代表采样点,μx和μy分别代表样本的均值。

2.根据权利要求1所述的一种基于半监督集成即时学习的工业混炼胶门尼粘度软测量方法,其特征在于,所述步骤(3)中的高斯过程回归模型GPR的建模过程为:

假设有数据集其回归模型可以描述为:

其中,x表示输入向量,f(·)表示未知的回归函数,ε为高斯噪声,服从均值为0、方差为的高斯分布;从函数空间角度来看,一个高斯过程可以由协方差函数C(x,x')和均值函数m(x)确定,其定义分别表示如下:

因此,高斯过程描述为:

f(x)~GP(m(x),C(x,x')) (3)

通常,对建模数据进行归一化数据预处理,假设训练样本集产生于一个零均值高斯过程,表示如下:

y~GP(0,C) (4)

其中,C是一个n×n阶对称正定的协方差矩阵;

当新的查询样本x*到来时,所述高斯过程回归模型描述为:

式中,k*=[C(x*,x1),…,C(x*,xn))]T,C(x*,x*)表示x*自身的协方差,和分别为高斯过程回归的预测均值和方差。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110458052.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top