[发明专利]一种适用于机器视觉的自然场景数据集的构建方法在审
申请号: | 201910561320.7 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110414561A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 王嘉乐;邹炼;范赐恩;程谟凡;陈丽琼;魏文澜;张捷 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06F16/951;G06F16/55 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适用于机器视觉的自然场景数据集的构建方法,包括如下步骤:基于生态系统类型确定数据集的分类类别;利用关键词从互联网上下载原始图像;对下载的图像进行初步匹配判断,对模糊类别图片进行再次分类,形成图像数据集;利用卷积神经网络对数据集进行验证,再根据混淆矩阵对歧义类别进行合并。解决了自然场景分类难以像物体分类进行准确客观定义的问题,为训练深度卷积神经网络提供了可靠的数据支撑,可用于自然场景识别系统。 | ||
搜索关键词: | 自然场景 数据集 卷积神经网络 机器视觉 构建 下载 矩阵 生态系统类型 图像数据集 分类类别 模糊类别 匹配判断 识别系统 数据支撑 物体分类 原始图像 歧义 分类 可用 混淆 互联 图像 验证 合并 图片 | ||
【主权项】:
1.一种适用于机器视觉的自然场景数据集的构建方法,其特征在于,包括以下步骤:步骤1:依据生态系统类型初步确定数据集中含有的类别与对应子类别;其中,生态系统类型分为:陆地生态系统:包括自然陆地生态系统和人工陆地生态系统;水生生态系统:包括内陆水生生态系统、海洋生态系统和人工水生生态系统;地下生态系统:包含洞穴生态系统;步骤2:将子类别名称作为关键字在互联网上进行搜索,至少搜索1000张与该子类别对应的图片,完成图片的收集;步骤3:对所收集到的图片进行初步的人工筛选,对不符合对应类别的图片进行进一步筛选,得到含有场景类别标签的数据集;步骤4:将数据集分为训练集和验证集,利用深度卷积神经网络对图像进行分类,并利用混淆矩阵将预测结果与真实类别标签结合生成相似度矩阵,依据相似度矩阵合并相似度过高的类别,得到最终的数据集,具体包括:步骤4.1,按照80%/20%的比例对原始数据集随机进行划分得到训练集和验证集;步骤4.2,将训练集中的图片转化为224×224分辨率的图片,选用13层的bn‑inception网络结构作为场景预测分类网络;含有两个卷积层和3×3池化层的原始bn‑inception网络将224×224分辨率的图片转化为28×28的特征图,使得在后续10个inception层中能够更快的进行处理,其中两层步长为2,其余步长为1,因此28×28的特征图最终变化为7×7的特征图;最后利用全局均值池化层对跨空间维度的激活进行聚合;步骤4.3,利用步骤4.2中所得到的模型对验证集进行分类预测,得到分类结果,将预测结果与真实分类结合得到混淆矩阵C,该混淆矩阵显示类别与类别之间的交叉错误,隐含地指示了它们之间的相似程度,在形式上,我们用以下方式定义这种相似性:S=C+CT其中C∈RN×N是混淆矩阵,N是自然场景类别的数目,Cij表示将第i类分类为第j类的概率,该值较大表示两个类别之间的模糊度较高;按照该公式生成相似度矩阵S,该等式保证了相似性是对称的度量,为合并两个相似类别提供线索;步骤4.4,设定一个合适的阈值τ,此处τ=0.5,将相似度超过该阈值τ的两类进行合并;分析合并的合理性,若第i行和第j行合并为同一类型,更新对应的相似性矩阵,删除第i和第j行和列,将
作为新的行和列添加进去,重复该步骤直到最终的数据集不超过阈值或满足其他要求,这样得到的数据集更适用于机器视觉方面的处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910561320.7/,转载请声明来源钻瓜专利网。