[发明专利]用于提供均匀的数据块的预处理方法在审
申请号: | 202110245763.2 | 申请日: | 2021-03-05 |
公开(公告)号: | CN113360339A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | T·托里卡 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06K9/62;G06N20/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 后云钟;王丽辉 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 提供 均匀 数据 预处理 方法 | ||
本发明涉及一种预处理方法,该预处理方法用于由时间上排序的、不均匀的数据集来提供均匀的数据块,其中所述数据集具有机器的所采集的运行参数的数值,以便获得适合于通过基于机器学习的算法来监控机器的数据块。所述方法包括:从所述数据集中形成数据块,使得每个数据块包括处于相应的时间段之内的数据集;对所述数据块中的数据集的量进行调整,使得所述数据块包含预先确定的数目的完整的数据集;并且将所述数据块中的数据集标准化,使得所述数据集具有用于预先确定的运行参数的、处于预先确定的数值范围之内的数值。
技术领域
本发明涉及一种用于由时间上排序的非均匀的数据集来提供均匀的数据块的预处理方法,其中所述数据集具有机器的所采集的运行参数的数值,以便获得适合于通过基于机器学习的算法来监控机器的数据块。尤其本发明涉及一种方法,该方法用于预处理所采集的机器传感器数据,使得所述机器传感器参数适合于在基于机器学习的、用于对机器进行监控的算法中的训练和使用。
背景技术
为了监控机器或机器部件,能够使用对机器的运行状态进行编码的模型。这些模型能够通过对于基于机器学习的算法的训练来获得,其中在训练时使用如下训练数据集,所述训练数据集具有在机器运行期间所采集的参数、特别是传感器数据。对于算法的训练和所训练的模型的质量、也就是尤其它们的识别机器的异常运行状态的能力主要取决于所采集的训练数据集的结构特性。
在工业应用中,在机器的运行中经常出现巨大差异(Varianz),例如同一台机器或结构相同的机器用于不同的应用中。即使在相同的应用中,也会出现不适合于训练机器监控模型的运行状态、例如待机状态。由此产生所采集的数据的大的差异,所采集的数据也就是非常不均匀的。
这种不均匀性被进一步扩大,因为在实践中使用的传感器通常提供处于非常不同的数值范围内并且具有不同质量的数据,因此传感器例如可能短时失灵或者数据传输可能受干扰;也可能出现由于传感器的故障功能而提供不可信的测量值的情况。
同样地,所采集的和在训练时所使用的运行参数和数据集的量可能大为不同,也就是说,训练数据集关于所采集的运行参数和数据的量是不均匀的。如果用不同大小的量的数据集来训练不同的模型,那么这就导致模型的不均匀的特性、例如模型的不同精度的误差极限,关于所述误差极限相应的模型将异常的运行状态与正常的运行状态分开。因此,很难将这些不同的模型进行比较并且决定在机器的运行中应当使用哪种模型。
总之,数据集和其中包含的数据值中的不均匀性导致用其训练的模型的质量欠缺和可比较性欠缺。在随后将这些模型用于进行机器监控时,这一点以及同样不均匀的数据集会导致错误的和不一致的结果,其中所述模型在使用中被运用到所述不均匀的数据集上。
发明内容
根据本发明,提出具有独立权利要求的特征的、一种用于提供均匀的数据块的预处理方法、一种相应的计算单元、一种相应的计算机程序和一种相应的存储介质。有利的设计方案是从属权利要求以及以下说明的主题。
借助于通过根据本发明的方法提供的数据块,一方面能够实现对于能相互比较的模型的有效训练,并且另一方面当在实际应用的期间所采集的数据集同样用根据本发明的方法来准备时,用所述数据块来训练的模型在以后的实际的在机器监控中的使用中提供一致的结果。将数据集合并成特定长度的数据块确保了所述训练分别基于相同的数据量。
根据本发明的预处理方法用于由时间上排序的、不均匀的数据集提供均匀的数据块,其中所述数据集具有机器的所采集的运行参数的数值,所述均匀的数据块适合于通过基于机器学习的算法来监控机器。所述预处理方法为此而包括:从所述数据集中形成数据块,使得每个数据块包括处于相应的时间段之内的数据集;对所述数据块中的数据集的量进行调整,使得所述数据块包含预先确定的数目的完整的数据集;并且将所述数据块中的数据集标准化,使得所述数据集具有用于预先确定的运行参数的、处于预先确定的数值范围之内的数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110245763.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置