[发明专利]一种面向智能制造多模态数据的分类方法有效
申请号: | 202110146422.X | 申请日: | 2021-02-03 |
公开(公告)号: | CN112784919B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 黎志豪;余志文;杨楷翔;孟献兵;陈俊龙 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F18/2415 | 分类号: | G06F18/2415;G06F18/25;G06F18/15;G06N3/0455;G06N3/047;G06N3/048;G06N3/084;G06N3/0985;G06F16/215;G06F16/27;G06F16/28;G06F16/182;G06F16/35;G0 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 智能 制造 多模态 数据 分类 方法 | ||
本发明公开了一种面向智能制造多模态数据的分类方法,包括步骤:1)收集和清洗生产数据日志,获取多模态数据;2)对多模态数据按其数据组成形式进行划分,并进行相应的预处理;3)对预处理后的多模态数据进行特征提取与特征融合,对融合后的特征进行分类。本发明通过对多模态数据进行预处理,结合自编码器和嵌入处理方式提取数据表层特征和挖掘数据深层特征,基于在线学习的方式,利用全连接前馈深度神经网络对数据进行实时分类及结果展示,有效提高了多模态数据分类的准确率及提升了AUC指标。
技术领域
本发明涉及计算机人工智能领域,尤其是指一种面向智能制造多模态数据的分类方法。
背景技术
随着工业4.0时代的到来和人工智能的飞速发展,许多传统工业行业以及新兴的医药制药行业的生产制造也开始走向智能化。而在智能制造大数据时代下,在工业生产、制药生产过程中,会产生大量结构复杂、难以分析的制造数据。如何从这些海量多模态生产数据中挖掘其背后的隐藏价值,对其进行有效分类,是现阶段智能制造研究领域的重点发展方向。针对当前智能制造多模态数据兼容性差、可拓展性低、模态不均衡性高、维度属性高等特点,如何保障数据的一致性、准确性、完整性和可靠性,并提高多模态数据处理的实时性、兼容性和可拓展性,是解决对智能制造多模态数据进行高效分类的关键所在。
发明内容
本发明的目的在于面向智能制造多模态数据,提出了一种面向智能制造多模态数据的分类方法,可有效解决多模态数据特征处理过于繁琐的缺点,已达到自动提取特征来提高数据分类的准确率及提升AUC指标。
为实现上述目的,本发明所提供的技术方案为:一种面向智能制造多模态数据的分类方法,包括以下步骤:
1)收集和清洗生产数据日志,获取多模态数据;
2)对多模态数据按其数据组成形式进行划分,并进行相应的预处理;
3)对预处理后的多模态数据进行特征提取与特征融合,对融合后的特征进行分类。
在步骤1)中,所述收集和清洗生产数据日志,获取多模态数据是指对智能制造生产平台的数据日志进行收集,并对其中的异常数据和噪声数据进行筛选过滤;所述异常数据是指针对生产日志的所有记录,在给定的时间片里,对数据在某些变量维度下的取值超出合理范围,或者数据不服从3σ原则下的正态分布,会将这些数据视为不合理、异常的;所述噪声数据是指智能制造生产平台在收集日志时因网络故障、数据样本缺失、时间戳偏差以及数据基础特征缺失的不正常因素而导致某些样本数据与正常样本数据的差异大于阈值,那么这些数据就会被视为噪声数据;上述异常数据和噪声数据会在数据清洗阶段被筛选过滤,将筛选过滤后的数据样本保存到以分布式文件系统HDFS为实现基础的存储模块中,并创建相应的Hive数据库表,得到原始的多模态数据。
在步骤2)中,对多模态数据按其数据组成形式进行划分,并进行相应的预处理是指服务器利用预处理层对不同形式数据采用不同的方法进行预处理,得到适用于后续处理的多模态数据,包括如下步骤:
2.1)对多模态数据按数据组成形式进行划分,分为图像类数据、文本类数据和数值型数据;
2.2)对步骤2.1)获得的图像类数据,获取其像素值矩阵并进行标准化预处理:
式中,所有原始图像数据的像素矩阵集合表示为n1表示原始图像数据的数目,au表示第u个原始图像数据的像素矩阵,其中u取值范围为1到n1;μA表示所有的原始图像数据的像素矩阵的均值;σA表示所有的原始图像数据的像素矩阵的标准差;表示第u个原始图像数据经过标准化处理后得到的像素矩阵;
当每个原始图像数据都完成标准化处理后,将得到的标准化像素矩阵替换掉对应的原始图像数据的像素矩阵,即得到预处理后的图像数据集合为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110146422.X/2.html,转载请声明来源钻瓜专利网。