[发明专利]一种基于深度卷积网络的显著性目标检测方法有效
申请号: | 201710238210.8 | 申请日: | 2017-04-13 |
公开(公告)号: | CN107423747B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 牛轶峰;马兆伟;王菖;赵哲 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 卷积 网络 显著 目标 检测 方法 | ||
本发明属于目标检测领域,公开了一种基于深度卷积神经网络的显著性检测方法,其步骤为:(1)网络训练数据构建,即根据给定的图像数据集及其标定的显著图,构建训练图像块数据样本集;(2)数据库预处理,即根据构建的训练数据库,需要对于每一个图像块数据的像素进行预处理;(3)网络结构设计,即通过设计深度网络结构(特指为I[28×28×3]‑C[24×24×20]‑P[12×12×20]‑C[8×8×50]‑P[4×4×50]‑FC[500)]‑O[1]),实现图像块中显著目标的提取;(4)网络结构训练,即利用深度卷积网络输出与标签数据的差异计算误差函数更新深度网络模型。本发明提出的方法鲁棒性较强,不需要人工设计特定的特征描述方式。
技术领域:
本发明主要涉及到目标检测领域,特指一种基于深度卷积网络的显著性目标检测方法。
背景技术:
受人类视觉感知外部环境的能力启发,显著性检测算法成为视觉领域近年来研究的热点。目前显著性检测技术还不够成熟,除了显著性算法本身的性能不够高以外,显著性信息的应用方式还不够完善,需要寻找更加令人满意的实现方法。近10年来,深度学习在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域都取得了巨大成功,已成为人工智能领域的重要分支之一。本专利拟采用深度学习技术,开展对于显著性目标检测的应用,尤其应用于无人机对空感知领域中。本专利期望借助深度学习网络自适应的特征学习与描述能力,通过有标签数据的训练,在检测过程中引入关于目标显著性的先验知识,从而准确且鲁棒地检测出环境中的显著物体,实现端对端的显著性目标提取。
发明内容:
本发明要解决的技术问题在于:提高显著性提取方法的鲁棒性,减少人工设计特定特征描述方法的使用。
针对现有技术存在的问题,本发明提供一种利用深度卷积神经网络实现显著性目标检测的方法,其主要步骤为:
(1)网络训练数据构建
根据给定的N张图像数据集及其标定的显著图,从每幅图像和相应的标注图中随机选择n张大小为m×m的图像块Ip,根据图像块对应的显著图块中的黑白像素数目确定其标签值。若白色像素多于黑色像素数目,则对应的标签值为1;否则为0。共构建的训练数据图像块样本集大小为n×N。
(2)数据库预处理
根据构建的训练数据库,需要对于每一个图像块数据Ip的像素进行以下预处理:
其中,Ip_database是构建的整个训练数据库;mean(·)是均值算子;max(·)是最大化算子,寻找最大的像素值;min(·)是最小化算子,寻找最小的像素值。
(3)网络结构设计
深度卷积网络结构的基本运算层主要包括:卷积层、池化层、全连接层,深度网络结构由各个运算层叠加运算组成。网络结构的设计主要对于整个网络中每一层的功能进行定义、每一层中卷积核的尺寸、卷积核的维度、池化层的运算子、降采样的降幅、激活函数类型等。其中,卷积运算定义为:
其中,深度网络结构共L层,l∈{1,···L},Il-1表示第l层卷积层的输入数据,Il表示第l层卷积层的输出数据,为卷积核,为偏置项,sigm(·)是sigmoid激活函数,表示卷积操作。
池化层,即降采样层,对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度;一方面进行特征压缩,提取主要特征,其定义为:
其中,是偏置项,downsample(·)表示在的输入图像块中每隔m×m个区域执行一次像素最大化降采样操作,各m×m个区域之间无重叠。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710238210.8/2.html,转载请声明来源钻瓜专利网。