[发明专利]基于自适应特征和离散余弦变换的视觉显著性检测方法在审
| 申请号: | 201610927514.0 | 申请日: | 2016-10-31 |
| 公开(公告)号: | CN106529549A | 公开(公告)日: | 2017-03-22 |
| 发明(设计)人: | 钱晓亮;耿盛涛;李祖贺;曾黎;王延峰;杨存祥;张鹤庆;刁智华;毋媛媛;吴青娥;贺振东;陈虎;过金超;张焕龙;刘玉翠;张秋闻;李清波 | 申请(专利权)人: | 郑州轻工业学院 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46 |
| 代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张绍琳;栗改 |
| 地址: | 450002 *** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提出了一种基于自适应特征和离散余弦变换的视觉显著性检测方法,步骤如下:根据输入图像的原始数据学习出滤波器模板,滤波器模板对图像进行滤波得到特征矩阵,再对图像的子特征进行自适应处理,将每个子特征的重要性进行量化,得到自适应特征矩阵;对自适应特征矩阵进行离散余弦变换,求其符号信息后进行离散余弦反变换,得到初始的视觉显著性图像;对初始的视觉显著性图像进行亮度值平方和高斯模糊,得到最终的视觉显著性检测结果。本发明对输入图像先缩放再计算,运算量小、检测效率高,同时又具有很高的检测正确率,得到的显著区域对计算机视觉领域的常见任务,如:场景理解、物体识别,目标跟踪等都具有重要意义。 | ||
| 搜索关键词: | 基于 自适应 特征 离散 余弦 变换 视觉 显著 检测 方法 | ||
【主权项】:
1.一种基于自适应特征和离散余弦变换的视觉显著性检测方法,其特征在于,其步骤如下:步骤一:自适应特征提取:步骤1:预处理:1)图像缩放:对大小为k×g的原始图像进行等比例缩放,缩放比例为a,缩放后的图像大小为ak×ag,其中,k、g均是非负整数,0<a<1,ak=round(k×a),ag=round(k×g),round(·)代表四舍五入运算;2)图像分块:从图像的左上角到右下角的顺次采用b×b的滑动窗口截取b×b的图像块,任意图像块都与水平和垂直方向的相邻图像块之间有50%的区域重叠,与±45°方向的相邻图像块之间有25%的区域重叠;将所有截取的图像块转换成列向量,并按照截取的次序组合成一个图像块向量矩阵,标记为X=[x1 ,x2 ,...xN ],其中X∈Cm×N ;其中,C代表自然数集合,xi 代表第i个图像块对应的列向量,其中i∈[1,N],N是图像块的个数,m是xi 的维数,m=b×b×c,c为图像通道数,b≥4,且b为偶数;步骤2:特征提取:1)滤波器模板组的学习:将图像块矢量矩阵X作为训练样本集,通过求解如下目标函数最小化问题得到滤波器模板组T: m i n α i ∈ R n 1 N Σ i = 1 N ( 1 2 | | x i - Tα i | | 2 2 + λ | | α i | | 1 ) - - - ( 1 ) ]]> 其中,T=[t1 ,t2 ,...tn ]∈Rm×n ,R代表实数集合;n代表滤波器模板组T中基向量的个数;αi 是计算过程中的一个中间变量,初值通过随机数设定;||·||1 和||·||2 分别代表1范数和2范数运算,λ是一个用于平衡误差和稀疏性的折衷参数;2)获取特征矩阵:对任意一个图像块xi 通过计算图像块向量xi 和滤波器模板组T中各个基向量的卷积得到图像块xi 的特征向量fi :fi =xi *T (2)其中,*代表卷积运算,fi ∈Rn ;所有图像块对应的特征向量组成图像的特征矩阵:F=[f1 ,f2 ...,fN ];步骤3:子特征自适应处理:将特征矩阵F进行转置得到转置矩阵F':F'=FT =[f1 ,f2 ...,fN ]T =[f1 ',f2 ',…fn '] (3)其中,F'∈RN×n ,fj '为特征矩阵F的第j个子特征向量,其中j∈[1,n];计算每个子特征向量fj '的1范数得矩阵Z:Z=[z1 ,z2 ,…zn ]=[||f1 '||1 ,||f2 '||1 ,…||fn '||1 ] (4)对矩阵Z进行1范数的单位化处理得矩阵P:P=[p1 ,p2 …pn ]=Z/||Z||1 (5);定义阈值函数TH(pj )为: T H ( p j ) = Σ k = 1 n I k ≠ j ( p k ) - I ( p j ) p j - p j - - - ( 6 ) ]]> 其中,Z∈R1×n ,P∈R1×n ,I(pj )=pj logpj ;对于矩阵P中的任意一个向量pj ,若TH(pj )>0,则保留pj 不变,若TH(pj )≤0,则令pj =0;处理后的矩阵P标记为矩阵P',将矩阵P'进行1范数归一化处理得到矩阵A:A=[a1 ,a2 ,…an ]=P'/||P'||1 (7);得输入图像的自适应特征矩阵Fa : 其中,A∈R1×n ,Fa ∈Rn×N ,afi 为第i个图像块xi 的自适应特征向量,AT 代表矩阵A的转置,其中AT ∈Rn , 代表矩阵之间的点对点相乘运算;步骤4:获取像素级自适应特征矩阵由于在图像分块时相邻图像块之间有区域重叠,同一像素点会被多个图像块所包含,单个像素的自适应特征通过计算所有包含该像素的图像块的自适应特征的均值得出: af ( x , y ) = 1 l Σ q = 1 l af q - - - ( 9 ) ]]> 其中,af(x,y) 代表坐标为(x,y)的像素点的自适应特征向量,其中,af(x,y) ∈Rn ;l代表所有包含像素点(x,y)的图像块的个数;afq 代表第q个包含像素点(x,y)的图像块的自适应特征,其中q∈[1,l];将所有像素点的自适应特征向量组合在一起得到整幅图像的像素级自适应特征矩阵Fap ;由于缩放后的图像大小为ak×ag,每个像素点的自适应特征向量是n维的列向量,因此Fap 是大小为ak×ag×n的三维矩阵;步骤二:基于自适应特征的离散余弦变换:像素级自适应特征矩阵Fap 拆分出n个ak×ag的二维矩阵、视为n个分辨率ak×ag的特征图像的组合,标记第j个特征图像为Yj ,其中Yj ∈Rak×ag ,对特征图像Yj 进行离散余弦变换得到余弦图像Yjc ,其中Yjc ∈Rak×ag :Yjc =COS(Yj ) (10)其中,COS(·)代表离散余弦变换;获取余弦图像Yjc 的符号图像Yjf ,其中Yjf ∈Rak×ag :Yjf =SIGN(Yjc ) (11)其中,SIGN(·)代表取符号操作;对符号图像Yjf 进行离散余弦反变换得到余弦反图像Sj ,其中Sj ∈Rak×ag :Sj =ICOS(Yjf ) (12)其中,ICOS(·)代表离散余弦反变换;对所有余弦反图像Sj 进行求和: S = Σ j = 1 n S j - - - ( 13 ) ]]> 其中,S为初始的视觉显著性图像,分辨率为ak×ag;步骤三:获取视觉显著性检测结果:步骤1:亮度值平方:对初始的视觉显著性图像S的亮度值进行平方: 其中, 代表两个矩阵的点对点相乘运算,S'是亮度值平方后的图像,其中S'∈Rak×al ;步骤2:高斯模糊:对亮度值平方后的图像S'进行高斯模糊得到模糊后的图像Sgm ,其中Sgm ∈Rak×ag :Sgm =S'*gm (15)其中,gm代表高斯模板;将模糊后的图像Sgm 缩放输入图像的原始尺寸k×g,并将所有像素点的灰度值进行四舍五入取整,得到最终的视觉显著性图像SM,其中SM∈Ck×g ,SM为输入图像的视觉显著性检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610927514.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种悬挂式园林鸟巢
- 下一篇:一种智能饲粮与饲料添加剂喂养系统





