[发明专利]一种感知视频编码方法有效

申请号：	201310697833.3	申请日：	2013-12-18
公开（公告）号：	CN103702121B	公开（公告）日：	2017-01-25
发明（设计）人：	张蕾;刘思远;陈乾友;熊荣东	申请（专利权）人：	四川九洲电器集团有限责任公司
主分类号：	H04N19/149	分类号：	H04N19/149;H04N19/147;H04N19/124;H04N19/597
代理公司：	成都九鼎天元知识产权代理有限公司51214	代理人：	韩雪
地址：	621000 四***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种感知视频编码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种感知视频编码方法，特别是涉及一种适用于多媒体技术和互联网技术发展中，对于视频信息基于人眼感知的视频编码方法。

背景技术

随着多媒体技术和互联网技术的迅速发展，视频信息已经遍布到世界各个角落，深刻地改变着人们的生活和工作方式。视频信息在多媒体信息中的核心地位，决定了视频处理技术在多媒体技术中扮演着重要的角色。由于视频信息数据量巨大，如何高效的压缩视频数据成为视频存储及在相对有限带宽下传输的关键。由ISO/IEC和ITU两大国际组织制定的国际视频编码标准H.264/AVC，融入了视频编码技术的优秀研究成果，在相同的编码图像质量下，该标准相对于以往的标准至少节省50%以上的码率，有效地推动了视频压缩技术的发展。

然而，随着信息的迅速膨胀传统视频业务已无法满足人们的要求，高清/超高清数字电视、立体/多视点视频等新兴视频应用需求的出现又对视频压缩技术提出了新的挑战。虽然，高清视频编码标准（High Efficiency Video Coding，HEVC）和多视点视频编码标准（Multi-view Video Coding，MVC）的出现在一定程度上提高了视频压缩的性能。但这类通过改进信号处理技术来消除视频冗余信息的方法，由于信号处理技术的约束其在压缩性能的改善上并没有实质性的技术突破，所以目前高清/超高清、立体/多视点视频的数据量仍是传统视频数据量的2倍以上，这是制约其广泛应用的主要瓶颈之一。

考虑到大部分视频信息的最终消费者是“人眼”，近年来国内外学者越来越多地关注到了感知视频编码（Perceptual Video Coding,PVC）技术的研究，其核心思想是：将人类视觉系统（Human Visual System,HVS）的研究成果引入视频编码技术中，以主观质量为依据优化视频编码资源分配。从现有的研究成果上看，这类方法与传统视频编码技术优化方法相比，更有可以突破性地提高视频压缩性能。

然而，现有的感知视频编码技术还没有达到最佳的编码效果，其原因主要在于：1）采用基于亮度、纹理、运动等相对简单、低级的视觉感知特性，难于充分准确地使用视觉感知特性来优化视频压缩性能；2）仍是以块为处理单元独立优化编码，难于实现以全局视觉感知为依据的整体率失真性能优化。对此，充分准确地利用人眼视觉感知特性，实现一种以全局视觉感知为依据的率失真性能优化编码框架，可以最大化视频压缩性能，从而更好地满足高清/超高清、立体/多视点等大数量视频应用的需求与发展。

发明内容

本发明要解决的技术问题是提供一种可以最大化视频压缩性能的感知视频编码方法。

本发明采用的技术方案如下：一种感知视频编码方法，具体方法为：将人眼视觉感知中的自由能量原则与视频编码原理相结合，根据自由能量中知觉优化预测能力的原则，实现视频编码中空时域预测准确性的全局优化；根据自由能量中行为减少预测误差的原则，实现视频编码中残差量化率失真性能的全局优化。

具体方法步骤为：步骤一、基于自由能量，进行全局视觉感知建模与感知优化的编码图像预处理；步骤二、对编码图像进行感知优化的空时域预测；步骤三、基于自由能量，进行全局率失真性能分析与全局视觉感知优化的量化参数图计算；步骤四、采用上一步中得到的量化参数图，对预测残差进行感知优化的变换与量化；步骤五、进行熵编码输出。

所述步骤一中进行全局视觉感知建模的方法为：根据人眼视觉感知的自由能量原则，以当前原始图像和其时域相关的已编码图像为基础，建立人眼视觉系统感知当前原始图像视觉信息的内部生成模型。

所述步骤一中进行全局视觉感知优化的编码图像预处理的方法为：根据视觉感知建模中得到的内部生成模型，计算原始图像中人眼视觉系统最大可感知的图像内容，并以所述最大可感知图像内容替代原始图像作为当前编码图像，用于后续的视频编码。

所述步骤二的具体方法为：根据视觉感知建模中得到的内部生成模型，建立当前编码图像与预测图像间的预测残差图像的自由能量计算模型，并以所述自由能量计算模型作为率失真优化中失真度的度量，按照传统视频编码中基于块的空时域预测方法，通过率失真优化技术获取当前编码图像的最佳预测图像，并对预测参数进行编码输出。

所述步骤三中进行全局率失真性能分析的具体方法为：由当前编码图像与最佳预测图像得到预测残差图像，根据视觉感知建模中得到的内部生成模型，分别建立自由能量与量化参数图的关系模型和编码码率与量化参数图的关系模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于四川九洲电器集团有限责任公司，未经四川九洲电器集团有限责任公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310697833.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种医院病人用多功能电动运送病床装置
下一篇：一种带独立液体冷却系统的电动机

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种感知视频编码方法有效

专利文献下载