[发明专利]一种适用于机器视觉的自然场景数据集的构建方法在审
申请号: | 201910561320.7 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110414561A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 王嘉乐;邹炼;范赐恩;程谟凡;陈丽琼;魏文澜;张捷 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06F16/951;G06F16/55 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然场景 数据集 卷积神经网络 机器视觉 构建 下载 矩阵 生态系统类型 图像数据集 分类类别 模糊类别 匹配判断 识别系统 数据支撑 物体分类 原始图像 歧义 分类 可用 混淆 互联 图像 验证 合并 图片 | ||
本发明公开了一种适用于机器视觉的自然场景数据集的构建方法,包括如下步骤:基于生态系统类型确定数据集的分类类别;利用关键词从互联网上下载原始图像;对下载的图像进行初步匹配判断,对模糊类别图片进行再次分类,形成图像数据集;利用卷积神经网络对数据集进行验证,再根据混淆矩阵对歧义类别进行合并。解决了自然场景分类难以像物体分类进行准确客观定义的问题,为训练深度卷积神经网络提供了可靠的数据支撑,可用于自然场景识别系统。
技术领域
本发明涉及图像处理技术领域,具体涉及一种适用于机器视觉的自然场景数据集的构建方法。
背景技术
在图像处理技术领域,近几年图像识别受到了越来越多的关注,图像识别技术是运动分析、立体视觉、数据融合等实用技术的基础,其中目标识别由于卷积神经网络和超大规模数据集的应用,在识别的准确率方面有了非常大的提升,而利用卷积神经网络对图像发生的场景进行识别却难以获得相同水平的准确度,这其中很大一部分原因是由于场景数据集自身分类不准确所导致的。
利用机器视觉对图像中物体进行识别可以提供图像中大概正在发生什么事情,而对图像发生的场景进行识别则能使我们获得更多与图片有关的信息,同时通过场景猜想过去和未来可能会发生什么事件。随着自动驾驶、无人车以及无人机技术的发展,对周围环境进行准确检测为安全提供了保障,因此一个标准的场景数据库显得尤为重要。
对于大多数场景数据库,往往存在着以下两个问题:1)类别与类别之间层次混乱,在某些数据集中存在“农田”和“平原”类别之间的混乱,其中平原是一种地貌类型,而农田也可以在平原上建立,两者之间并非独立;2)含义重复混淆,例如“林场”与“森林”只有在特殊情况下才会进行区分。
不同于物体数据集的构建过程中类别标签有着客观的评价,场景数据集经常由于主观评价不同而对同一幅图像有着不一样的判定标准,这也导致了同一类别中图像之间差异很大,限制了算法准确度的提升,因此在场景数据集中需要建立一个统一的分类准则。
对于一个自然场景,生物与环境帮助我们确定场景的具体类型,而生物与环境构成的统一整体在生态学研究中被称为生态系统,这些生态系统具有最为多种的种类和大小,通过生态系统的分类来对自然场景数据集中的分类进行对应,使数据集的分类满足一个统一的判定尺度。
判定一张图像所属的自然场景,需要结合图像中的物体和背景;判定某一空间所属的生态系统,需要结合该空间中的生物和环境;两者在判定上有着极大的相似性,因此该发明提出将生态系统作为数据集类别的判定尺度,即生态系统中的类别对应自然场景数据集中的类别,这样操作无论是从分类的主观感受上还是客观要求上都是基本一致的。
发明内容
为了解决上述问题,本发明提供了一种构建自然场景数据库的方法,旨在改善现有数据集分类中缺陷,使得在构造自然场景数据集分类时有一个统一的分类准则,并且使最终的数据集能更好地适用于机器视觉领域。
为实现上述目的,本发明的技术方案具体包括以下步骤:
1.一种适用于机器视觉的自然场景数据集的构建方法,其特征在于,包括以下步骤:
步骤1:依据生态系统类型初步确定数据集中含有的类别与对应子类别;其中,生态系统类型分为:
陆地生态系统:包括自然陆地生态系统和人工陆地生态系统;
水生生态系统:包括内陆水生生态系统、海洋生态系统和人工水生生态系统;
地下生态系统:包含洞穴生态系统;
步骤2:将子类别名称作为关键字在互联网上进行搜索,至少搜索1000张与该子类别对应的图片,完成图片的收集;
步骤3:对所收集到的图片进行初步的人工筛选,对不符合对应类别的图片进行进一步筛选,得到含有场景类别标签的数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910561320.7/2.html,转载请声明来源钻瓜专利网。