[发明专利]一种工业机器人视觉语义分割数据库制作方法有效
申请号: | 201710535729.2 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107481244B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 张印辉;张春全;何自芬;武玉琪;张越 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/194;G06F16/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工业 机器人 视觉 语义 分割 数据库 制作方法 | ||
本发明涉及一种工业机器人视觉语义分割数据库制作方法,属于数字图像处理技术领域。本发明采集机械零件和工具不同背景、不同样本的图像若干副;将图像中出现的每一种类别的目标区域和背景抠图处理,再进行填充,并对目标区域进行描边操作;再将图像中背景区域和类别区域的像素值归类,将图像转换为cdata格式,将cdata图像与colormap叠加,完成原图像Ground‑truth制作。本发明建立的数据库可用于深度学习网络模型训练、验证、检测,完成深度学习网络对常见常用机械零件和工具的检测识别任务;此外能根据实际需要,建立多种类别的数据库,以满足多类别目标检测和识别任务。
技术领域
本发明涉及一种工业机器人视觉语义分割数据库制作方法,属于数字图像处理技术领域。
背景技术
近几十年来,工业4.0的迅速普及,工业机器人对目标的检测和识别成为了机器视觉领域研究的热点之一,并成为许多自动化、智能化制造生产系统中不可或缺的一部分。机械零件和工具的检测识别是伴随着现代工业生产应运而生,在现代智能制造中,尤其在自动化装配工作中,能够在不同背景下检测和识别出零件、工具是非常关键的工作环节,它在提高制造工作中的检测、装配、分选、入库的工作效率,降低劳动成本等方面有非常重大的意义。
随着人工智能的不断发展,目前已经出现了众多具备智能检测和识别不同目标的家用机器人,而工业机器人的智能化发展还相对比较滞后;在人工智能技术领域,深度学习是目前比较热门的一个研究领域,而深度学习需要大量样本对神经网络模型进行训练和检测,因此,图像数据库是人工智能的重要基础。
目前,已经有众多的数据库支撑深度学习理论发展和研究,例如:手写数字数据库(MNIST)、Imagenet数据库、COCO(Common Objects in Context)、PASCAL VOC、CIFAR、OpenImage等。然而,上述所有数据库的样本类别均为日常生活中常见的目标,例如:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)等。真正适用于工业机器人平台视觉检测和识别任务的语义分割的标准数据库却极为少见,制约了深度学习在机械工业领域的应用和扩展。
本发明由国家自然科学基金项目(No.61461022和No.61302173)资助研究,主要在于提出一种工业机器人视觉语义分割数据库制作方法,解决机械领域语义分割标准数据库的建立和制作问题,为深度学习在机械工业领域的应用和扩展提供数据支持。
发明内容
本发明提供了一种工业机器人视觉语义分割数据库制作方法,主要利用PhotoShop和Matlab软件解决机械领域语义分割标准数据库的建立和制作问题,为深度学习在机械工业领域的应用和扩展提供数据支持。
本发明的技术方案是:一种工业机器人视觉语义分割数据库制作方法,首先,利用图像采集设备采集机械零件和工具不同背景、不同样本的图像若干幅;然后将图像中出现的每一种类别的目标区域和背景抠图处理,分别利用一种颜色对目标区域和背景区域进行填充,并对目标区域进行描边操作;再将图像中背景区域和5种类别的目标区域的像素值分别归为0~5,将图像转换为cdata格式,将cdata图像与colormap叠加,完成原图像Ground-truth制作。
所述方法的具体步骤如下:
Step1、首先利用图像采集设备采集5种常见机械零件和工具不同背景、不同数量、相同类别不同样本工具场景下的图像若干幅,5种常见机械零件和工具包括轴承、起子、齿轮、钳子、扳手;其次图像采集时利用不同背景、不同数量、相同类别不同样本工具的场景,实现采集得到的图像多样化;
Step2、对采集得到的图像利用PhotoShop软件对图像中出现的不同类别区域抠图,将抠出的区域利用对应的RGB值进行填充和描边处理,将所有背景区域填充为黑色,将图像保存为PNG格式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710535729.2/2.html,转载请声明来源钻瓜专利网。