[发明专利]一种适用于机器视觉的自然场景数据集的构建方法在审
申请号: | 201910561320.7 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110414561A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 王嘉乐;邹炼;范赐恩;程谟凡;陈丽琼;魏文澜;张捷 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06F16/951;G06F16/55 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然场景 数据集 卷积神经网络 机器视觉 构建 下载 矩阵 生态系统类型 图像数据集 分类类别 模糊类别 匹配判断 识别系统 数据支撑 物体分类 原始图像 歧义 分类 可用 混淆 互联 图像 验证 合并 图片 | ||
1.一种适用于机器视觉的自然场景数据集的构建方法,其特征在于,包括以下步骤:
步骤1:依据生态系统类型初步确定数据集中含有的类别与对应子类别;其中,生态系统类型分为:
陆地生态系统:包括自然陆地生态系统和人工陆地生态系统;
水生生态系统:包括内陆水生生态系统、海洋生态系统和人工水生生态系统;
地下生态系统:包含洞穴生态系统;
步骤2:将子类别名称作为关键字在互联网上进行搜索,至少搜索1000张与该子类别对应的图片,完成图片的收集;
步骤3:对所收集到的图片进行初步的人工筛选,对不符合对应类别的图片进行进一步筛选,得到含有场景类别标签的数据集;
步骤4:将数据集分为训练集和验证集,利用深度卷积神经网络对图像进行分类,并利用混淆矩阵将预测结果与真实类别标签结合生成相似度矩阵,依据相似度矩阵合并相似度过高的类别,得到最终的数据集,具体包括:
步骤4.1,按照80%/20%的比例对原始数据集随机进行划分得到训练集和验证集;
步骤4.2,将训练集中的图片转化为224×224分辨率的图片,选用13层的bn-inception网络结构作为场景预测分类网络;含有两个卷积层和3×3池化层的原始bn-inception网络将224×224分辨率的图片转化为28×28的特征图,使得在后续10个inception层中能够更快的进行处理,其中两层步长为2,其余步长为1,因此28×28的特征图最终变化为7×7的特征图;最后利用全局均值池化层对跨空间维度的激活进行聚合;
步骤4.3,利用步骤4.2中所得到的模型对验证集进行分类预测,得到分类结果,将预测结果与真实分类结合得到混淆矩阵C,该混淆矩阵显示类别与类别之间的交叉错误,隐含地指示了它们之间的相似程度,在形式上,我们用以下方式定义这种相似性:
S=C+CT
其中C∈RN×N是混淆矩阵,N是自然场景类别的数目,Cij表示将第i类分类为第j类的概率,该值较大表示两个类别之间的模糊度较高;按照该公式生成相似度矩阵S,该等式保证了相似性是对称的度量,为合并两个相似类别提供线索;
步骤4.4,设定一个合适的阈值τ,此处τ=0.5,将相似度超过该阈值τ的两类进行合并;分析合并的合理性,若第i行和第j行合并为同一类型,更新对应的相似性矩阵,删除第i和第j行和列,将作为新的行和列添加进去,重复该步骤直到最终的数据集不超过阈值或满足其他要求,这样得到的数据集更适用于机器视觉方面的处理。
2.根据权利要求1所述的一种适用于机器视觉的自然场景数据集的构建方法,其特征在于,所述生态系统子类别分类要满足:
条件一、子类别属于某一生态系统;
条件二、子类别之间相互独立。
3.根据权利要求1所述的一种适用于机器视觉的自然场景数据集的构建方法,其特征在于,子类别分为:
自然陆地生态系统:极地与高山苔原、半沙漠、针叶林、落叶林、天然草原、荒地、常绿阔叶林、地中海型灌木丛、沙漠、山地、热带雨林;
人工陆地生态系统:人工草地、农田、温室、城市;
内陆水生生态系统:沼泽、湿地、河流、湖泊;
海洋生态系统:沿海、珊瑚礁、深海;
人工水生生态系统:池塘;
包含洞穴生态系统:洞穴。
4.根据权利要求1所述的一种适用于机器视觉的自然场景数据集的构建方法,其特征在于,步骤2所述类别名称加上天气形容词,天气形容词包括:晴朗的、多云的、下雨的、下雪的。
5.根据权利要求1所述的一种适用于机器视觉的自然场景数据集的构建方法,其特征在于,步骤3所述不符合对应类别的图片挑出汇总至未分类图片,若总搜集图片为M张,总类别为N类,当无法分类的图片超过N/M时,构建新的类别,新的类别满足步骤1中述的子类别分类条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910561320.7/1.html,转载请声明来源钻瓜专利网。