[发明专利]基于视觉潜在注意力目标区域的JPEG2000图像编解码方法有效
申请号: | 201010597655.3 | 申请日: | 2010-12-21 |
公开(公告)号: | CN102036073A | 公开(公告)日: | 2011-04-27 |
发明(设计)人: | 薛建儒;李策;郑南宁 | 申请(专利权)人: | 西安交通大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/30 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 汪人和 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视觉 潜在 注意力 目标 区域 jpeg2000 图像 解码 方法 | ||
技术领域
本发明属于图像编解码领域,是一种新颖的基于视觉潜在注意力目标区域的JPEG2000图像编解码方法。
背景技术
随着Internet、电信网、移动通信等技术的逐渐融合,日益剧增的Internet和宽带无线数字媒体业务需求,极大的推动了可伸缩信息压缩及其可靠性传输的理论和应用研究。已有大量实验证明,人眼在浏览一幅图像时,其注视点会因潜在目标区域的注意力强弱而产生视注意力分配的先后顺序,即因注意力引起的一种注视点跳跃的过程。同时,由于人眼视觉的非均匀采样生理机制,使得人类对注视点区域与非主视点区域,亦即对不同注意力目标区域的视觉采样疏密程度是不同的。从静态图像压缩技术的典型代表——JPEG2000技术来看,其图像压缩算法仅是将用户设定的码率均匀分配给每一个图像片(Tile块),并没有考虑到图像中内容注意力的差别,无法根据图像内容视觉注意力大小分配码率。这使得其所重构的图像无法适应人类视觉对不同注意力目标区域分配不同注意力的特征。换句话说,即传统JPEG2000技术实现的图像编码算法对图像区域选择单一且无法自动给出区域码率预分配系数;不能很好的体现人类视觉感知的层次性。同时,在终端多样、网络异构以及网络带宽有限的情况下,也无法根据图像内容的视觉注意力程度优先传输相应的图像内容。针对上述问题,如何在图像编解码算法中引入图像内容自适应编码机制成为了业界的研究重点。
发明内容
基于上述背景,本发明目的旨在提出一种符合人类视觉感知机制,基于视觉潜在注意力目标区域的JPEG2000图像编解码算法,使得用户在各种网络环境下,尽可能优先的观看图像中较为显著、更加注意的目标区域。本发明的基本思想是:人类视觉对图像中所示现的各个目标的关注度是不同的。图像编解码方法中应反映图像中各个目标被注意的程度,亦即应根据各目标区域注意力的大小分配不同的码率。
为使图像压缩后更加符合视觉感知特性,该方法图像编码前先根据视觉潜在注意力目标区域提取技术,按照不同的潜在注意力目标区域将图像划分为若干个Tile块;并对这些Tile块按其视觉注意力系数大小预先分配相应的目标码率;而后经过量化,自适应小波变换,位平面编码与算术编码器的码字重置机制及基于潜在注意力目标区域质量层码率控制技术形成码流,随后组织码流与打包生成JPEG2000文件完成图像压缩。在浏览时,实施与上述对应的逆过程进行图像解压缩。最终实现本发明图像编解码方法。
为了实现上述任务,本发明采用的技术解决方案是:
基于视觉潜在注意力目标区域的JPEG2000图像编解码方法,其特征在于,该方法包括下述步骤:
1)建立了基于视觉潜在注意力目标区域的JPEG2000图像编解码技术系统架构;通过视觉潜在注意力目标区域提取技术,计算视觉显著性注意力图,并对输入图像进行视觉潜在注意力目标区域分割,从而得到图像中若干个潜在注意力目标区域及其注意力系数,并在原始图像R、G、B三个图像分量中,划分为若干个对应的具有相同注意力系数的Tile块;
2)根据用户给定的压缩目标码率,并通过计算各Tile块间注意力系数比值,实现对每个Tile块的目标码率预分配;
3)根据视觉潜在注意力目标区域划分的Tile块经过DC位移、分量变换、自适应小波变换以及量化,得到每个Tile块在各级分辨率下量化后的小波系数;
4)通过基于视觉潜在注意力目标区域的Tile块小波系数区域索引技术,实现Tile块在各级分辨率下的Precinct索引结构;
5)通过位平面编码以及算术编码重置技术,实现对Precinct进行编码,记录候选失真度与编码码字长度;最后将编码结果、候选失真度以及对应的码字长度一起输出至下一过程;
6)通过构造Precinct质量层和基于Precinct质量层的码率控制技术,并根据步骤2)中预分配的目标码率、步骤4)中区域索引数组、各质量层码字长度,实施Precinct质量层码率控制形成截断码流以及打包,实现基于潜在注意力目标区域的图像编码;
7)依上述步骤的逆过程进行,即可获得按用户要求码率实现的基于视觉潜在注意力目标区域的图像解码与重构,从而获得反映视觉潜在注意力的重构图像。
所述视觉潜在注意力目标区域提取技术是指,根据自底向上视觉注意力空域计算模型,获得输入图像的视觉显著性注意力系数图;提取得到输入图像的若干个潜在注意力目标区域。由此,实现与输入图像R、G、B三个图像分量对应的若干个潜在注意力目标区域图像的Tile块划分,以及与这些Tile块对应的注意力系数。其具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010597655.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种3D视频播放方法及系统
- 下一篇:一种激光电视机