[发明专利]利用最小熵判断视觉感知饱和的图像自适应缩小方法有效
申请号: | 201810365927.3 | 申请日: | 2018-04-23 |
公开(公告)号: | CN108573472B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 潘晨;徐文龙;叶家建;郭娅茜 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 最小 判断 视觉 感知 饱和 图像 自适应 缩小 方法 | ||
本发明公开了一种利用最小熵判断视觉感知饱和的图像自适应缩小方法,包括以下步骤:1)利用不同缩小倍数Ki,通过对原图像下采样,构造出多个缩小图Ii;2)分别对Ii用显著点预测算法计算显著图Si,其中显著度值大于平均值的像素点作为注视点;3)注视点形成注视区域,求出该区域质心;统计距质心点不同距离范围的注视点频数;4)计算各缩小图像中,由注视点与质心距离生成的熵值Ei;5)比较不同缩小倍数Ki下的Ei,其最小值对应的Ki是最佳图像缩小倍数。本发明引入熵值并利用人类视觉机制自动选择合适的图像缩小尺度,从而降低数据量、提高算法性能。
技术领域
本发明涉及计算机视觉技术领域,具体地讲是一种利用最小熵判断视觉感知饱和的图像自适应缩小方法。
背景技术
图像分辨率的提高,使得像素数量几何倍数增加。面对海量视频图像数据,传统基于像素的图像处理算法面临严重的挑战。一方面人们致力于不断提高计算机系统硬件速度来减缓这种压力;另一方面,对传统图像处理算法做合理改进,使之更适应处理海量像素数据,是一种有效的解决问题思路。
从人类视觉的角度而言,由于视网膜面积和光感受器数量有限,人眼通常通过晶状体调整和瞳孔缩放实现外界场景在视网膜上投影的尺度变化和目标聚焦。场景在视网膜上的投影是适当缩小的图像。缩小图像——利用下采样方式,缩小图像到一个合适尺度,能大大降低数据量。缺点是下采样过程中,过分的下采样往往会丢失小目标、模糊目标边缘。应用中的关键问题是图像缩小到多大尺度最合适?因此如何选择合理的缩小尺度是个亟待解决的问题。
现有技术通常是由人累试不同的图像缩小尺度,经验性地选择一个对大多数任务都合适的固定参数。对于变化的实际场景,这种做法有严重局限性。为了克服图像算法对于尺度的敏感性,通常还采用多尺度图像同时并行处理方式,即同时生成多个不同尺度的缩小图,通过各个尺度图像处理结果做后处理(集成),来获得最终图像处理结果。缺点是此类方法有很高的时间复杂度。
发明内容
有鉴于此,本发明要解决的技术问题是,提供一种图像自动缩小方法,利用最小熵判断判断视觉感知饱和程度,选择可最容易引起感知饱和的图像尺度作为图像缩小的最佳依据。
本发明的技术解决方案是,提供以下步骤的利用最小熵判断视觉感知饱和的图像自适应缩小方法,包括以下各步骤:
1)利用不同缩小倍数Ki,通过对原图像I进行下采样,构造出多个缩小尺度图Ii。
2)分别对缩小尺度图Ii用显著点预测算法计算得到显著图Si,选择显著图Si中显著度值大于平均值的像素点作为注视点;
3)所述注视点形成注视区域,由各点位置信息计算注视区域的质心;对各注视点到质心的距离做归一化将各点到质心点距离作为变量来统计一定距离范围内的注视点频数,则各点到质心点的距离信息被转换为概率,进而表示为熵值;
4)计算各个缩小尺度图Ii中,由注视点与质心点的距离形成的熵值Ei;
5)比较熵值Ei,其最小值对应的缩小倍数Ki作为最佳图像尺度。
作为改进,注视时的微跳视幅度表示为一种信息熵,作为一种感知产生的指标,所述熵值最小时对应的缩小图像,最快产生感知饱和,优先输出视觉目标。
作为改进,对原图像I(x,y)进行二维离散傅里叶变换,将图像由空间域转换到频域,得到相位P(u,v)信息:
将相位信息经傅里叶逆变换后,可以在空间域得到显著度图像Sa_Map;
Sa_Map(x,y)=|F-1[exp{jP(u,v)}]|2 (2)
式中F和F-1表示二维离散傅里叶正、逆变换,表示相位运算;根据显著度图,注视点的位置可用下列公式求出:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810365927.3/2.html,转载请声明来源钻瓜专利网。