[发明专利]一种基于合成少数类过采样和深度学习的故障预测方法在审
申请号: | 201811619342.6 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109871862A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 房红征;任帅;杨浩;熊毅;隋景峰;余家豪;罗凯;樊焕贞;王菲 | 申请(专利权)人: | 北京航天测控技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 郭德忠;李爱英 |
地址: | 100041 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于合成少数类过采样和深度学习的故障预测方法,首先用K‑Means方法对样本集中的少数类样本进行聚类,并删除聚类后的噪声类簇,而后在每一个类簇中利用KNN方法将类簇分为噪声类样本、故障类样本以及风险类样本,并删除其中的噪声类样本,最后在每一个类簇中输入一个随机数并根据随机数与类簇中故障类样本以及风险类样本的比例关系选择某个样本作为输出样本,实现SMOTE方法过采样,然后再通过倍增操作增加了少数类样本的数量,使得最终得到的融合样本中的样本类别更均衡,也就使得采集的特征数据均衡,从而便于开展模型训练,最大化的挖掘出数据背后的规律,实现较好的故障预测效果。 | ||
搜索关键词: | 样本 类簇 故障预测 过采样 噪声 随机数 聚类 删除 合成 均衡 模型训练 输出样本 特征数据 样本类别 最大化 倍增 采集 学习 背后 融合 挖掘 | ||
【主权项】:
1.一种基于合成少数类过采样和深度学习的故障预测方法,其特征在于,包括以下步骤:S1:获取故障原始数据,统计故障原始数据中各故障样本类别的样本数目,若样本数目大于预设阈值,则该故障样本类别为多数类,若不大于,则该故障样本类别为少数类;S2:采用K‑Means方法对少数类中的样本进行聚类,得到类簇,其中类簇的数量用R表示;S3:采用离差平方和法,分别获取步骤S2中各类簇与所述多数类的距离,将距离最小者对应的类簇作为噪声类簇,并将噪声类簇从步骤S2中的类簇中删除,剩余R‑1个类簇;S4:采用KNN法,将步骤S3中剩余的每一个类簇中的样本划分为噪声类样本、故障类样本以及风险类样本,然后将各类簇中的噪声类样本删除,得到R‑1个更新类簇;S5:依次对各更新类簇分别执行风险故障选择操作,得到各更新类簇的输出样本,其中,所述风险故障选择操作具体为:设定一个随机数α∈[0,1],并将更新类簇中故障类样本的数量表示为s,风险类样本的数量表示为d,且令
若
则选择风险类样本作为输出样本,否则选择故障类样本作为输出样本;S6:依次将步骤S5中各更新类簇的输出样本中的每一个样本作为中心样本,然后基于中心样本执行倍增操作,得到各中心样本的倍增样本,则各输出样本中各样本对应的倍增样本的集合为倍增样本集合,其中,所述倍增操作的具体步骤为:在中心样本的K个最近邻样本点中随机选择N个近邻样本,其中N至少为2;所述N个近邻样本分别与中心样本进行随机的线性插值,得到的N个更新样本为所述倍增样本;S7:将各个倍增样本集合、步骤S4中所述的剩余类簇以及步骤S1中所述的多数类进行样本融合,得到融合样本;S8:将融合样本按照设定比例分为训练样本和测试样本,然后采用训练样本训练CNN与LSTM的组合分类器,再采用训练好的CNN与LSTM的组合分类器对测试样本进行故障预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天测控技术有限公司,未经北京航天测控技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811619342.6/,转载请声明来源钻瓜专利网。