[发明专利]基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用在审
申请号: | 201910624662.9 | 申请日: | 2019-07-11 |
公开(公告)号: | CN110414383A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 袁烨;周倍同;程骋;李星毅;马贵君 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/66;G06N3/04 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 源域 迁移 特征集 故障判断 样本集 对抗 学习 故障诊断能力 标记样本 网络结构 样本数据 多工况 敏感度 目标域 应用性 最大化 最小化 判据 收敛 应用 引入 保证 | ||
本发明涉及一种基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用,包括:采用待迁移的卷积神经网络,得到源域标记样本集的源域特征集和源域故障判断集以及目标域样本集的目标特征集;以最大化源域特征集和目标特征集之间的Wasserstein距离并最小化Wasserstein距离和源域故障判断集的判断损失值的加和为目标,基于收敛判据,实现卷积神经网络的对抗迁移学习。本发明在卷积神经网络的迁移学习中引入Wasserstein距离,以Wasserstein距离最大为目标,提高对两种样本集所提取的特征的区分敏感度,再以Wasserstein距离和源域故障判断集的损失值的加和最小为目标,以提高卷积神经网络的判断精度,在保证故障诊断能力的同时对样本数据和网络结构要求低,可适用于多工况间迁移,实际应用性强。
技术领域
本发明属于工业过程故障诊断领域,更具体地,涉及一种基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用,
背景技术
故障诊断旨在通过使用获取的测量数据和其他信息,监测和分析机器状态来隔离系统上的故障,想做到上述这点需要具有高超技能、经验丰富的专家,这增加了使用人工智能技术做出故障诊断决策的需求。实时故障诊断框架的部署允许维护团队提前采取行动来更换或修复受影响的组件,从而提高生产效率并保证操作安全。因此,精确的诊断轴承故障对机械制造系统的可靠性和安全性具有关键意义。
许多先进的信号处理和机器学习技术已被用于故障诊断。在过去几年中,深度学习模型(例如,深度置信网络,稀疏自动编码器,尤其是卷积神经网络),在故障诊断任务中,比基于规则和基于模型的方法,表现出更好的拟合和学习能力,其旨在利用相关源域的知识(具有足够的标记数据),在目标域(标记数据不足或没有标记数据)中进行学习,从而节省了从头开始重建一个新的故障诊断模型的大量时间和计算成本。
然而,上述深度学习模型仍存在两个困难:1)大多数方法需要基于独立同分布假设,即源域和目标域任务的样本集需要相同的分布。因此,当面对新的诊断任务时,提前训练的网络的适应性受到限制,其中新任务的不同操作条件和物理特性可能导致新样本集(目标样本集)和原始样本集(源样本集)之间的分布差异,导致的结果是:对于新的故障诊断任务,深度学习模型通常是需要从头开始训练,这导致计算资源和训练时间的浪费;2)目标域中标记或未标记的数据不足是另一个常见问题。在实际工业情况下,对于新的诊断任务,收集足够的典型样本以构建大规模和高质量的数据集来训练网络是极其困难的。并且由于难以在封装设备中安装足够的传感器,同时,工业打标通常需要昂贵的人力。因此,域适应的挑战在于无法在目标域中采集到有标记的数据或者只能收集到少量的有标记数据。
基于上述挑战,目前深度迁移学习算法做了一些改进,一种是基于采集数据的迁移网络,主要是通过为源域中采集的数据分配适当的权重值,将源域中所选择的数据移植到目标域中作为数据补充,这种迁移学习方法不依赖模型且对数据相似度要求较高。第二种是基于网络结构的迁移网络是指对源域预先训练的部分网络进行迁移,包括其网络结构和连接参数,将其转换为目标域中使用的深度神经网络的一部分,但这种迁移学习方法只针对某些网络结构有较好的效果,如:LeNet,AlexNet,VGG,Inception,ResNet。第三种是基于域融合的迁移网络,其中最大平均差异法最为常见,但这种最大平均差异法,计算成本将随着样本数的增加而呈四次方增长,这限制了MMD在许多具有大数据集的实际应用中的适用性。
因此,开发一种工业实用性强且故障诊断能力高的深度迁移学习算法,是目标工业过程故障诊断领域亟待解决的技术问题。
发明内容
本发明提供一种基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用,用以解决现有深度迁移学习方法在保证工业过程故障诊断能力的同时对实际样本数据和/或神经网络结构要求较高而导致难以应用于实际工业过程的技术问题。
本发明解决上述技术问题的技术方案如下:一种基于Wasserstein距离的卷积神经网络对抗迁移学习方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910624662.9/2.html,转载请声明来源钻瓜专利网。