[发明专利]基于U网络和对抗学习的显著性检测方法有效
申请号: | 201810036637.4 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108171701B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 路红;姚泽平;杨博弘 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 对抗 学习 显著 检测 方法 | ||
本发明属于计算机数字图像处理技术领域,具体为一种基于U网络和对抗学习的显著性检测方法。本发明步骤为:构建深度神经网络:神经网络整体设计基于对抗生成网络,包含生成器与鉴别器,生成器在结构上使用了自编码器结构与跳跃连接,主要由编码器和译码器组成,编码器是由编码模块组成,编码模块使用了堆叠的残差模块,译码器主要由解码器组成,也使用了堆叠的残差模块;训练深度神经网络:使用公开的、真实场景下的显著性图像数据集,利用多尺度的图像内容损失函数与对抗损失函数,训练前一步中构建的深度神经网络;利用训练好的网络模型,对自然图像进行检测,再将得到的结果进行后处理,得到最终的结果。本发明方法能够提高显著性检测的准确性。
技术领域
本发明属于计算机数字图像处理技术领域,具体涉及一种基于U网络和对抗学习显的著性检测方法。
背景技术
随着数字图像处理技术的不断发展,图像显著性检测被广泛应用到图像压缩,图像分类,目标识别,图像分割等多个领域。
目前计算机在处理复杂场景的图像时,需要耗费大量的时间和计算能力,如果能够模仿人类的视觉注意力机制,像人眼一样不受复杂背景影响而准确快速地确定场景中的显著区域或目标,并进行优先处理,舍弃非显著区域,可有效地提高图像处理的效率和准确性。根据人类的视觉特点,视觉显著性主要可以分成三类:一类是基于数据驱动、独立于具体任务,自底向上的显著检测;一类是受意识支配,依赖于具体任务,自顶向下的显著检测;一类是前两类的结合。显著性源于视觉的独特性、不可预测性,这是由颜色、亮度、边界、梯度、纹理等图像属性所致,由于缺乏高层知识,大多数算法都是属于自底向上的显著检测。
尽管目前的自底向上的显著性检测算法取得了不错的效果,但仍存在几个问题需要解决。首先,这些方法利用图像颜色,亮度,边界,梯度,纹理等底层特征属性来决定图像某个区域和它周围的对比度,虽然现有的大部分的图像显著度方法一般容易检测到目标,但是集中在图像的边缘上,难以均匀的高亮整个显著目标。其次,就是因为不知道目标的大小和位置,所以需要大量的重复计算对整幅图像进行搜索。最后,在背景比较复杂的情况下,依赖于低层次特征的视觉信息,容易丢失感兴趣目标的信息,从而对结果产生影响。本发明通过设计深度神经网络来提取高级视觉信号提高显著性检测的准确性。
发明内容
本发明的目的在于克服以上技术中的缺陷,提供一种高效的、准确的显著性检测方法。
本发明提出的显著性检测方法,是一种基于U网络和对抗学习的显著性检测的方法,其具体步骤如下:
(1)构建深度神经网络;
(2)训练深度神经网络;
(3)利用训练好的网络模型进行显著性检测;
(4)利用全连接的条件随机场进行后处理。
步骤(1)所述的构建深度神经网络,具体过程如下:
(11)构造生成器,其具体步骤如下:
(111)构造编码模块:包含6个编码块,每个编码块由顺序连接的3个残差块和最大池化组成,其具体步骤如下:
(1111)构造残差块,其具体步骤如下:
(11111)定义卷积层,每个卷积层的卷积核大小都为3×3,步长都为1;
(11112)定义批标准化层;
(11113)定义非激活函数;
(11114)将卷积层,批标准化层,非激活函数顺序连接,再加上残差连接组成残差块
(1112)构造最大池化层;
(1113)将残差块和最大池化层顺序堆叠起来组成编码块;
(1114)将6个编码块顺序连接起来;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810036637.4/2.html,转载请声明来源钻瓜专利网。