[发明专利]一种基于生成对抗网络的知识蒸馏数据增强方法与系统有效
申请号: | 202110197819.1 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112819090B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 徐子昕;鲁统伟 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 唐万荣 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 知识 蒸馏 数据 增强 方法 系统 | ||
本发明提供了一种基于生成对抗网络的知识蒸馏数据增强方法与系统,通过易操作的数据增强方式,提高了卷积网络对工业数据集的定位能力和识别准确率。本发明结合了生成对抗网络高效拟合样本数据分布和知识蒸馏中对神经网络模型容错率改善的算法,实现了在生成增强样本时不引入非信息噪声、提高了模型对错误标签的鲁棒性。本发明降低了工业数据集正负样本标注错误而产生的对模型的误导,提升了工业数据集在语义分割任务上的表征表达性能,提高了模型在特征粒度区分小的情况下对样本特征的学习能力,在汽车零部件检测与制造、铁路零部件定位等应用中发挥了重要的作用。
技术领域
本发明属于数据增强技术领域,具体涉及一种基于生成对抗网络的知识蒸馏数据增强方法与系统。
背景技术
数据增强是一种在原有数据集上通过一定的变换方式增加数据量的方法。其目的在于训练神经网络分类器时,有足够比例的样本使得分类器在训练过程中将数百万的参数调整到模型损失最佳点。
现有数据增强的丢弃、填充和融合策略往往会引入较多的非信息噪声,降低样本的信噪比,在语义分割时会将目标区域识别错误。另外工业数据正负样本区别小,在人工标注过程中存在误差,出现标注区域偏移,错误等问题。这些方法在定位能力和识别准确率上都难以令人满意。
发明内容
本发明要解决的技术问题是:提供一种基于生成对抗网络的知识蒸馏数据增强方法与系统,用于提高卷积网络对工业数据集的定位能力。
本发明为解决上述技术问题所采取的技术方案为:一种基于生成对抗网络的知识蒸馏数据增强方法,包括以下步骤:
S1:搭建一种基于生成对抗网络的知识蒸馏数据增强方法的数据增强系统,包括输入模块、增强图像模块、网络训练模块和知识蒸馏模块;输入模块的输出端分别连接增强图像模块的输入端和网络训练模块的输入端,增强图像模块的输出端和网络训练模块的输出端分别连接知识蒸馏模块的输入端;
S2:向系统输入待增强数据集并确认待增强图像的格式;
S3:选取固定尺寸的掩模与待增强图像相乘运算,进行区域丢弃得到补丁图像;
S4:生成对抗网络对丢弃区域填补补丁,根据补丁图像的像素分布,生成一块填补区域补全补丁图像,进行再生成得到增强后图像;
S5:通过卷积神经网络对待增强数据集进行五折交叉检验训练得到神经网络分类器模型;
S6:神经网络分类器模型对增强后图像进行计算得到预测值S;
S7:进行知识蒸馏,将原始图像标签ground_truth与预测值S加权相加混和得到增强图像标签;
S8:系统输出图像形式的包括增强后图像和增强图像标签的最终结果。
按上述方案,所述的步骤S2中,待增强数据集中的待增强图像为RGB三通道图;若待增强数据集中的图像为单色图、ARGB四通道图或BGR三通道图,则系统读入待增强图像后进行通道转化变为RGB三通道图。
按上述方案,所述的步骤S3中,具体步骤为:
S31:在待增强图像的宽的取值范围内和高的取值范围内生成一块由像素值0组成的掩模,掩模的大小为待增强图像的大小的
S32:将图像与掩模进行乘法运算。
按上述方案,所述的步骤S4中,具体步骤为:
S41:通过生成对抗网络生成判别器;判别器包括3个卷积层和1个全连接层;
S42:通过生成对抗网络生成生成器;生成器包括编码器和解码器,编码器包括4个卷积层,解码器包括2个上采样层和3个卷积层;
S43:冻结判别器,训练生成器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110197819.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种兼具点-面双重打击能力的复合动能弹
- 下一篇:一种企业模拟经营管理系统