[发明专利]一种汽车配件图片数据集制作方法在审
| 申请号: | 201910718143.9 | 申请日: | 2019-08-05 |
| 公开(公告)号: | CN110569379A | 公开(公告)日: | 2019-12-13 |
| 发明(设计)人: | 曾万贵;黄俊钧 | 申请(专利权)人: | 广州市巴图鲁信息科技有限公司 |
| 主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/58;G06F16/951;G06K9/62 |
| 代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 颜希文;麦小婵 |
| 地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 汽车配件 图片 计算机视觉 标签信息 数据扩充 存储格式 可用数据 数据增强 图片数据 图片添加 测试集 数据集 训练集 验证集 分类 采样 分层 筛选 制作 统一 | ||
本发明公开了一种汽车配件图片数据集制作方法,通过获取多个汽车配件图片,从多个汽车配件图片中筛选出符合要求的第一图片,并统一第一图片的尺寸及存储格式,再将第一图片进行数据增强处理,生成多个数据扩充后的图片,并将多个数据扩充后的图片作为第二图片,然后根据第一图片预先分类的信息,为第二图片添加相应的标签信息,最后根据标签信息,对第二图片进行分层采样,生成分类好的训练集、验证集以及测试集,采用本发明提供的实施例,能够生成高质量的数据集,用于与汽车配件图片相关的计算机视觉任务,解决了与汽车配件图片相关的计算机视觉任务无现成可用数据集的问题。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种汽车配件图片数据集制作方法。
背景技术
数据集是在各种场景下应用算法模型的基础,高质量的数据集能够最大程度地提高算法模型在任务中的性能表现。
在与汽车配件图片相关的计算机视觉应用场景下,用于训练模型的汽车配件图片存在如下问题:
(1)数量有限;
(2)格式(尺寸、存储格式)不统一;
(3)无标签(标签指这张图片代表什么配件/包含哪些配件/配件在图片中的具体位置/图中哪些像素属于某个配件)。
简言之,目前无现成的汽车配图片件数据集。
发明内容
本发明实施例的目的是提供一种汽车配件图片数据集制作方法,解决了与汽车配件图片相关的计算机视觉任务无现成可用数据集的问题。
为实现上述目的,本发明实施例提供了一种汽车配件图片数据集制作方法,包括以下步骤:
获取多个汽车配件图片,从所述多个汽车配件图片中筛选出符合要求的第一图片,并统一所述第一图片的尺寸及存储格式;其中,符合要求的汽车配件图片为拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片;
将所述第一图片进行数据增强处理,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
根据所述第一图片预先分类的信息,为所述第二图片添加相应的标签信息;
根据所述标签信息,对所述第二图片进行分层采样,生成分类好的训练集、验证集以及测试集。
进一步的,所述多个汽车配件图片的获取方式,包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取,以及通过拍摄采集获取。
进一步的,所述数据增强处理方法,包括几何变换处理法、颜色变换处理法,以及对抗生成网络处理法;
所述几何变换处理法,通过将第一图片进行不同方位的翻转,以及不同方向不同角度的旋转,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
所述颜色变换处理法,通过将第一图片进行降噪处理、高斯模糊处理,以及不同颜色变化处理,生成多个数据扩充后的图片,并将所述多个数据扩充后的图片作为第二图片;
所述对抗生成网络处理法,通过将第一图片输入至所述对抗生成网络,以使所述对抗生成网络进行自主生成多个类似的图片,并将所述多个类似的图片作为第二图片;
其中,每种数据增强处理方法对第一图片进行数据增强处理后生成的多个图片均不100%相同。
进一步的,所述第一图片预先分类的信息,通过以下方式获得:
在获取到所述多个汽车配件图片后,对所述多个汽车配件图片进行分类,并根据每个类别中的每个汽车配件图片,生成相应的标签文件;
其中,所述标签文件包括对应图片的存储路径或名称,以及是否为配件的标记信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市巴图鲁信息科技有限公司,未经广州市巴图鲁信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910718143.9/2.html,转载请声明来源钻瓜专利网。





