[发明专利]一种基于变分自编码器的图像显著性检测方法有效
申请号: | 201811113241.1 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109360191B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 孙正兴;徐峻峰;李博;胡佳高 | 申请(专利权)人: | 南京大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/90;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码器 图像 显著 检测 方法 | ||
1.一种基于变分自编码器的图像显著性检测方法,其特征在于,包括如下步骤:
步骤1,输入图像,筛选背景样本;
步骤2,通过背景样本训练变分自编码器深度网络模型;
步骤3,通过变分自编码器深度网络模型计算超像素重建错误,得到图像的显著性值;
步骤1包括如下步骤:
步骤1-1,使用SLIC简单线性迭代聚类方法将输入的整幅图像划分为N1个超像素,并计算每个超像素的平均CIELab颜色统计特征值;
步骤1-2,使用K-means聚类算法通过对超像素CIELab颜色统计特征值进行聚类得到图像区域,并计算每个图像区域的边界连通性;
步骤1-3,计算图像区域中超像素的边界连通性;
步骤1-4,根据超像素的边界连通性计算得到超像素属于背景的概率;
步骤1-2中,使用如下公式计算每个图像区域的边界连通性:
其中RGm代表图像中第m个区域,bdconn(RGm)代表第m个区域的边界连通性,SPi代表图像中第i个超像素,BD代表边界区域,即图像最外围超像素组成的区域;
步骤1-3中,使用如下公式计算图像区域中超像素的边界连通性:
bdconn(SPi)=bdconn(RGm),SPi∈RGm,
其中,bdconn(SPi)表示第i个超像素的边界连通性,第i个超像素的边界连通性与其所在图像区域的边界连通性相同;
步骤1-4中,通过如下公式计算得到超像素属于背景的概率:
其中bgPro(SPi)代表第i个超像素属于背景的概率,表示平衡权重,选取属于背景的概率大于或等于N2的超像素组成背景样本集合B;
步骤2包含如下步骤,
步骤2-1,构建一个深度为5的变分自编码器深度网络模型,包括输入层,隐藏层一,变分层,隐藏层三,输出层,相邻两层之间采用全连接方式连接,其中输入层单元数量为N3,对应于超像素中包含的像素RGB值,隐藏层单元数量为N4,网络为对称设计形式,即变分自编码器中编码器部分和解码器部分网络结构对称一致;
步骤2-2,使用反向传播和随机梯度下降法训练变分自编码器深度网络模型:每一个隐藏层需要训练的参数为Wj和bj,输入为向量x,表示背景样本集合B中超像素SPi中像素RGB值,输出为向量当进行反向传播时,输入为向量y,输出为向量是网络中使用的非线性激活函数;训练过程中,损失函数L定义为编码解码交叉熵和KL散度之和,公式如下:
其中q(z|x)为输入向量x在变分空间z中的高斯分布,p(x|z)是输出向量在变分空间z中的高斯分布通,损失函数前项表示交叉熵损失,后项DKL(q(z|x)||p(z))是KL散度,对每个隐藏层,分别使用随机梯度下降法,最小化L,得到参数Wj和bj。
2.根据权利要求1所述的方法,其特征在于,步骤3包含如下步骤,
步骤3-1,对于图像中第i个超像素SPi,xi表示其RGB像素值,通过训练得到的变分自编码器深度网络模型,得到xi对应的编码解码结果从而计算得到该超像素SPi的变分重建错误
步骤3-2,通过第i个超像素SPi的变分重建错误计算得到第i个超像素SPi的显著性值
步骤3-3,采用步骤3-1~步骤3-2的方法得到N1个超像素的显著性值,从而得到图像的显著性值。
3.根据权利要求2所述的方法,其特征在于,步骤3-1中,通过如下公式计算得到第i个超像素SPi的变分重建错误
4.根据权利要求3所述的方法,其特征在于,步骤3-2中,通过如下公式计算得到第i个超像素SPi的显著性值
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811113241.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序