[发明专利]一种汽车配件图片数据集制作方法在审
| 申请号: | 201910718143.9 | 申请日: | 2019-08-05 |
| 公开(公告)号: | CN110569379A | 公开(公告)日: | 2019-12-13 |
| 发明(设计)人: | 曾万贵;黄俊钧 | 申请(专利权)人: | 广州市巴图鲁信息科技有限公司 |
| 主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/58;G06F16/951;G06K9/62 |
| 代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 颜希文;麦小婵 |
| 地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 汽车配件 图片 计算机视觉 标签信息 数据扩充 存储格式 可用数据 数据增强 图片数据 图片添加 测试集 数据集 训练集 验证集 分类 采样 分层 筛选 制作 统一 | ||
1.一种汽车配件图片数据集制作方法,其特征在于,包括以下步骤:
获取多个汽车配件图片,从所述多个汽车配件图片中筛选出符合要求的第一图片,并统一所述第一图片的尺寸及存储格式;其中,符合要求的汽车配件图片为拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片;
将所述第一图片进行数据增强处理,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
根据所述第一图片预先分类的信息,为所述第二图片添加相应的标签信息;
根据所述标签信息,对所述第二图片进行分层采样,生成分类好的训练集、验证集以及测试集。
2.如权利要求1所述的汽车配件图片数据集制作方法,其特征在于,所述多个汽车配件图片的获取方式,包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取,以及通过拍摄采集获取。
3.如权利要求2所述的汽车配件图片数据集制作方法,其特征在于,所述数据增强处理方法,包括几何变换处理法、颜色变换处理法,以及对抗生成网络处理法;
所述几何变换处理法,通过将第一图片进行不同方位的翻转,以及不同方向不同角度的旋转,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
所述颜色变换处理法,通过将第一图片进行降噪处理、高斯模糊处理,以及不同颜色变化处理,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
所述对抗生成网络处理法,通过将第一图片输入至所述对抗生成网络,以使所述对抗生成网络进行自主生成多个类似的图片,并将所述多个类似的图片作为第二图片;
其中,每种数据增强处理方法对第一图片进行数据增强处理后生成的多个图片均不100%相同。
4.如权利要求3所述的汽车配件图片数据集制作方法,其特征在于,所述第一图片预先分类的信息,通过以下方式获得:
在获取到所述多个汽车配件图片后,对所述多个汽车配件图片进行分类,并根据每个类别中的每个汽车配件图片,生成相应的标签文件;
其中,所述标签文件包括对应图片的存储路径或名称,以及是否为配件的标记信息。
5.一种汽车配件图片数据集制作装置,其特征在于,包括:图片获取模块、数据处理模块、标签信息模块以及数据集生成模块;
所述图片获取模块,用于获取多个汽车配件图片,从所述多个汽车配件图片中筛选出符合要求的第一图片,并统一所述第一图片的尺寸及存储格式;其中,符合要求的汽车配件图片为拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片;
所述数据处理模块,用于将所述第一图片进行数据增强处理,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
所述标签信息模块,用于根据所述第一图片预先分类的信息,为所述第二图片添加相应的标签信息;
所述数据集试生成模块,用于根据所述标签信息,对所述第二图片进行分层采样,生成分类好的训练集、验证集以及测试集。
6.如权利要求5所述汽车配件图片数据集制作装置,其特征在于,所述多个汽车配件图片的获取方式,包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取,以及通过拍摄采集获取。
7.如权利要求6所述汽车配件图片数据集制作装置,其特征在于,所述数据增强处理方法,包括几何变换处理法、颜色变换处理法,以及对抗生成网络处理法;
所述几何变换处理法,通过将第一图片进行不同方位的翻转,以及不同方向不同角度的旋转,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
所述颜色变换处理法,通过将第一图片进行降噪处理、高斯模糊处理,以及不同颜色变化处理,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
所述对抗生成网络处理法,通过将第一图片输入至所述对抗生成网络,以使所述对抗生成网络进行自主生成多个类似的图片,并将所述多个类似的图片作为第二图片;
其中,每种数据增强处理方法对第一图片进行数据增强处理后生成的多个图片均不100%相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市巴图鲁信息科技有限公司,未经广州市巴图鲁信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910718143.9/1.html,转载请声明来源钻瓜专利网。





