[发明专利]一种针对于深度学习的数据集标记方法在审
申请号: | 201910992334.4 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110764790A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 权龙哲;刘睿琪;姜伟;王千祎;赵成顺;吴家琪;曹欢 | 申请(专利权)人: | 东北农业大学 |
主分类号: | G06F8/61 | 分类号: | G06F8/61;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150030 黑龙*** | 国省代码: | 黑龙;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 学习数据 命令提示符 数据集标记 格式需求 目标检测 人工标注 高效率 数据集 正确率 主流 配置 优化 网络 学习 图片 | ||
本发明公开了一种针对于深度学习的数据集标记方法,其利用命令提示符搭建标注工具所需环境,并优化深度学习数据集标注策略;在Windows系统中配置labelImg及其所需Python库,labelImg操作简便,可以满足目前主流目标检测网络YOLO、SSD、Fast R‑CNN等对数据集的格式需求,并且能够在一张图片中标注多个同类目标,提高了深度学习数据集的标注效率和标注精度,降低了人工标注成本具有高效率、高正确率、低修改成本等特点。
技术领域:
本发明涉及一种在Windows系统下的深度学习数据集标注工具LabelImg的环境配置,及其标注数据集的具体方法。
背景技术:
近年来,深度学习发展迅猛,已经被广泛应用于图像识别领域、语音识别领域、视频分析领域、文本分析领域和大数据分析领域,并取得了成功。基于视觉的目标检测是图像处理和计算机视觉领域的重要研究方向之一,可应用于自动驾驶系统中的车辆、行人、交通标志等目标检测,视频监控中的异常事件分析,以及服务机器人等诸多领域。
随着深度神经网络的发展,包括图像分类、目标检测以及语义分割等方面的研究均取得了显著进展。特别是在目标检测领域,出现了以R-CNN、Fast RCNN为代表的two-stage网络框架,和以YOLO、SSD为代表的one-stage的网络框架。
无论何种网络框架,都要对数据集中的待检测物体特征与位置进行回归学习,并且其检测精度也高度依赖与数据集的大小与质量。LabelImg是一种操作方便的可视化图像标注工具,支持目前主流目标检测算法所需的数据集格式,并且能够在一张图片中标注多个同类目标。
本发明针对Windows10系统,对标注工具LabelImg进行环境配置,利用其方便快捷的操作方式,对深度学习数据集进行标记。
发明内容:
本发明要解决的问题是提供一种针对于深度学习的数据集标注方法,利用利用命令提示符搭建标注工具所需环境,并优化深度学习数据集标注策略,提高了深度学习数据集的标注效率和标注精度,降低了人工标注成本具有高效率、高正确率、低修改成本等特点。
为实现上述目的,本发明所提供的技术方案为:
(1)下载安装Windows版本的Python和pip;
(2)下载并解压LabelImg软件;
(3)在步骤(1)安装Python和pip的基础上,在cmd中用pip安装PyQt5、pyqt5_tools、lxml;
(4)在步骤(3)的基础上,在步骤(2)的解压后的文件夹下在cmd中利用命令:pyrcc5-o resources.py resources.qrc将Qt文件格式改为Python格式;
(5)在步
(6)在LabelImg软件解压后的文件夹下用Python调用labelImg.py,打开LabelImg;
(7)在步骤(6)打开后的labelImg界面中,Open Dir按键选取待标记图片所在文件夹;Change Save Dir案件选取标记后的.xml文件存储位置;
(8)将标记好的图像按一定比例划分,即可得到深度学习所需的训练集与验证集。
附图说明:
图1为软件安装与标注流程图
图2为Python下载步骤
图3为labelImg软件环境配置步骤
图4为labelImg软件界面
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北农业大学,未经东北农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910992334.4/2.html,转载请声明来源钻瓜专利网。