[发明专利]高斯混合模型的隐变量确定方法及装置、设备、介质在审
申请号: | 202210460579.4 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114817844A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 王达一;郑毅贤;吴文超;张琪萱 | 申请(专利权)人: | 西门子(中国)有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06K9/62;G06F17/18;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100102 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混合 模型 变量 确定 方法 装置 设备 介质 | ||
本发明实施例提供了一种高斯混合模型的隐变量确定方法及装置、设备、介质。该方法包括:S1、基于高斯混合模型的训练样本集,设置隐变量的初始值;S2、根据训练样本集中各个工况对应的样本数量,确定训练样本集对应的样本权重矩阵;S3、根据样本权重矩阵和隐变量的当前值,确定本次迭代过程对应的响应度矩阵;S4、根据本次迭代过程对应的响应度矩阵,对隐变量的当前值进行更新;S5、判断更新后的隐变量的当前值是否满足收敛条件;若是,则结束本方法,并将更新后的所述隐变量的当前值作为最优解;否则,返回到S3中,以执行下一次迭代过程。本发明能够更好地解决工业场景中的样本不平衡的问题。
技术领域
本发明涉及工业预测技术领域,特别涉及一种高斯混合模型的隐变量确定方法及装置、设备、介质。
背景技术
在工业预测性维护的应用实践中,利用高斯混合模型拟合实际生产场景中的正常运行模式时,绝大多数情况会存在样本数量不平衡的情况。这是因为生产中往往存在不同的工况,且每个工况的运行时间并不完全相当,因此有的工况会产生较多的样本,而有的工况会产生较少的样本,从而造成了样本不平衡的问题。对于样本数量较少的工况,模型预警效果将存在偏差。
目前上述问题的主要解决方案为合成少数类过采样技术(英文为SyntheticMinority Oversampling Technique,缩写为SMOTE),即通过扩充少数类样本来解决不平衡的问题。本质上,这项技术是通过在较少数量样本中已经存在的数据点之间随机插入人造数据来增加其数据量。但这样的方式在高维度空间中效果不佳,在工况比较接近的情况下会引入噪声。因此当前的解决方案不能很好地解决工业场景中样本不平衡的问题。
发明内容
本发明提供了一种高斯混合模型的隐变量确定方法及装置、设备、介质,能够更好地解决工业场景中样本不平衡的问题。
第一方面,本发明一个实施例提供一种高斯混合模型的隐变量确定方法,包括:
S1、基于所述高斯混合模型的训练样本集,设置所述隐变量的初始值;
S2、根据所述训练样本集中各个工况对应的样本数量,确定所述训练样本集对应的样本权重矩阵;其中,所述样本权重矩阵中包括所述训练样本集中每一训练样本的样本权重;在所述训练样本集对应的各个工况中,一个工况对应的样本数量越少,该工况对应的各个训练样本的样本权重越大;
S3、根据所述样本权重矩阵和所述隐变量的当前值,确定本次迭代过程对应的响应度矩阵;其中,所述响应度矩阵中包括每一个工况下的每一个训练样本分别针对所述高斯混合模型的各个高斯核的响应度,一个训练样本针对一个高斯核的响应度为该训练样本属于该高斯核的期望概率;
S4、根据本次迭代过程对应的响应度矩阵,对所述隐变量的当前值进行更新;
S5、判断更新后的所述隐变量的当前值是否满足收敛条件;
若是,则结束本方法,并将更新后的所述隐变量的当前值作为最优解;
否则,返回到S3中,以执行下一次迭代过程。
可选的,所述根据所述训练样本集中各个工况对应的样本数量,确定所述训练样本集对应的样本权重矩阵,包括:
采用第一计算式计算所述训练样本集中的第n个训练样本的样本权重,所述第一计算式包括:
式中,Wn为第n个训练样本的样本权重,sin为第n个训练样本所属的第i个工况对应的样本数量,sj为第j个工况对应的样本数量,I为所述训练样本集对应的各个工况的数量。
可选的,所述隐变量包括每一个高斯核的核权重和每一个高斯核的核参数,所述核参数包括平均值矩阵和协方差矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子(中国)有限公司,未经西门子(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210460579.4/2.html,转载请声明来源钻瓜专利网。