[发明专利]一种基于变分自编码器的图像显著性检测方法有效

专利信息
申请号: 201811113241.1 申请日: 2018-09-25
公开(公告)号: CN109360191B 公开(公告)日: 2020-06-12
发明(设计)人: 孙正兴;徐峻峰;李博;胡佳高 申请(专利权)人: 南京大学
主分类号: G06T7/00 分类号: G06T7/00;G06T7/90;G06K9/62;G06N3/04;G06N3/08
代理公司: 江苏圣典律师事务所 32237 代理人: 胡建华;于瀚文
地址: 210023 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 编码器 图像 显著 检测 方法
【权利要求书】:

1.一种基于变分自编码器的图像显著性检测方法,其特征在于,包括如下步骤:

步骤1,输入图像,筛选背景样本;

步骤2,通过背景样本训练变分自编码器深度网络模型;

步骤3,通过变分自编码器深度网络模型计算超像素重建错误,得到图像的显著性值;

步骤1包括如下步骤:

步骤1-1,使用SLIC简单线性迭代聚类方法将输入的整幅图像划分为N1个超像素,并计算每个超像素的平均CIELab颜色统计特征值;

步骤1-2,使用K-means聚类算法通过对超像素CIELab颜色统计特征值进行聚类得到图像区域,并计算每个图像区域的边界连通性;

步骤1-3,计算图像区域中超像素的边界连通性;

步骤1-4,根据超像素的边界连通性计算得到超像素属于背景的概率;

步骤1-2中,使用如下公式计算每个图像区域的边界连通性:

其中RGm代表图像中第m个区域,bdconn(RGm)代表第m个区域的边界连通性,SPi代表图像中第i个超像素,BD代表边界区域,即图像最外围超像素组成的区域;

步骤1-3中,使用如下公式计算图像区域中超像素的边界连通性:

bdconn(SPi)=bdconn(RGm),SPi∈RGm

其中,bdconn(SPi)表示第i个超像素的边界连通性,第i个超像素的边界连通性与其所在图像区域的边界连通性相同;

步骤1-4中,通过如下公式计算得到超像素属于背景的概率:

其中bgPro(SPi)代表第i个超像素属于背景的概率,表示平衡权重,选取属于背景的概率大于或等于N2的超像素组成背景样本集合B;

步骤2包含如下步骤,

步骤2-1,构建一个深度为5的变分自编码器深度网络模型,包括输入层,隐藏层一,变分层,隐藏层三,输出层,相邻两层之间采用全连接方式连接,其中输入层单元数量为N3,对应于超像素中包含的像素RGB值,隐藏层单元数量为N4,网络为对称设计形式,即变分自编码器中编码器部分和解码器部分网络结构对称一致;

步骤2-2,使用反向传播和随机梯度下降法训练变分自编码器深度网络模型:每一个隐藏层需要训练的参数为Wj和bj,输入为向量x,表示背景样本集合B中超像素SPi中像素RGB值,输出为向量当进行反向传播时,输入为向量y,输出为向量是网络中使用的非线性激活函数;训练过程中,损失函数L定义为编码解码交叉熵和KL散度之和,公式如下:

其中q(z|x)为输入向量x在变分空间z中的高斯分布,p(x|z)是输出向量在变分空间z中的高斯分布通,损失函数前项表示交叉熵损失,后项DKL(q(z|x)||p(z))是KL散度,对每个隐藏层,分别使用随机梯度下降法,最小化L,得到参数Wj和bj

2.根据权利要求1所述的方法,其特征在于,步骤3包含如下步骤,

步骤3-1,对于图像中第i个超像素SPi,xi表示其RGB像素值,通过训练得到的变分自编码器深度网络模型,得到xi对应的编码解码结果从而计算得到该超像素SPi的变分重建错误

步骤3-2,通过第i个超像素SPi的变分重建错误计算得到第i个超像素SPi的显著性值

步骤3-3,采用步骤3-1~步骤3-2的方法得到N1个超像素的显著性值,从而得到图像的显著性值。

3.根据权利要求2所述的方法,其特征在于,步骤3-1中,通过如下公式计算得到第i个超像素SPi的变分重建错误

4.根据权利要求3所述的方法,其特征在于,步骤3-2中,通过如下公式计算得到第i个超像素SPi的显著性值

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811113241.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top