[发明专利]一种基于邻域查询的机械监测标签数据质量保障方法有效
申请号: | 202110095846.8 | 申请日: | 2021-01-25 |
公开(公告)号: | CN112800041B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 李德光;任祯琴;闫晓婷;朱婷婷;王翔宇;李男杰 | 申请(专利权)人: | 洛阳师范学院 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06Q50/04 |
代理公司: | 无锡市兴为专利代理事务所(特殊普通合伙) 32517 | 代理人: | 屠志力;朱荣富 |
地址: | 471934 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 邻域 查询 机械 监测 标签 数据 质量 保障 方法 | ||
本发明提供一种基于邻域查询的机械监测标签数据质量保障方法,通过提取不同故障标签样本数据时域、时频特征,转换为样本的特征指标集合,然后基于以上特征,通过查询未标记样本数据的邻域中对象个数,与
技术领域
本发明属于机械监测及故障诊断领域,具体涉及一种基于邻域查询的机械监测标签数据质量保障方法。
背景技术
机械设备状态的准确诊断对于防止重大事故、提高设备生产经济效益具有十分重要的意义。特别是近年来,由于大量监测测点的设置,传感器采样频率的提高,积累了海量数据。基于深度学习的机械故障诊断技术对于海量监测数据的快速处理并完成故障诊断发挥了重要作用,被广泛应用于了设备的监测及诊断。
然而,设备运行的工业现场,环境嘈杂,采集的监测数据夹杂大量的噪点数据,导致监测数据质量的降低,使得监测大数据价值密度降低,难以从中挖掘出有用的监测信息。深度学习算法具有“垃圾进,垃圾出”的缺点,面对低质量监测数据,会学到错误的监测信息,最终训练获得错误的诊断模型,导致诊断准确率降低。由此可见,检测出原始监测数据中的噪点样本数据,并将其清洗,获得高质量的监测数据是深度学习准确诊断模型获得的前提和基础。此外,用于深度学习模型训练的不同标签数据间存在一定差异性,也进一步加大了噪点样本数据被准确检测的难度。
发明内容
本发明的目的在于克服现有技术中存在的不足,提供一种基于邻域查询的机械监测标签数据质量保障方法,能够检测并清除噪点样本数据,从而完成了监测数据质量的保障。本发明采用的技术方案是:
一种基于邻域查询的机械监测标签数据质量保障方法,包括以下步骤:
1)获得机械设备多种健康状态的标签样本数据,标签类别数量记为S;标签样本数记为N;
2)对每样本数据提取时域特征和时频域特征,组成特征指标集合D{Xij},D{Xij}中Xij表示第i个样本数据的第j个特征指标向量;
3)将样本数据的特征指标集合D{Xij}中所有对象标记为未处理状态;
4)初始化ε以及Minpts的值;ε作为给定对象邻域的寻找半径;
5)从特征指标集合D{Xij}中取出Xi样本,,初始计算时i=1;
6)判断Xi是否完成标记,若标记则执行后面步骤,否则i=i+1,并执行步骤5);
7)计算Xi的ε邻域Nε(Xi);
8)计算邻域Nε(Xi)内对象的个数(不包括Xi本身),判断是否大于Minpts,若不大于则标记Xi为噪点数据样本,i=i+1,并执行步骤5);
9)否则,将Xi标记为高质量监测数据,并建立簇C,将Xi及邻域Nε(Xi)内对象都归入簇C;
10)将邻域Nε(Xi)内对象的邻域内对象数量大于Minpts的未标记样本归入簇C;
11)i=i+1,重复执行步骤5)及其以后步骤,直至iN时结束;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于洛阳师范学院,未经洛阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110095846.8/2.html,转载请声明来源钻瓜专利网。