[发明专利]利用视觉感知特性指导多视点视频编码量化过程的方法有效
申请号: | 201210402003.9 | 申请日: | 2012-10-22 |
公开(公告)号: | CN103124347A | 公开(公告)日: | 2013-05-29 |
发明(设计)人: | 王永芳;商习武;刘静;宋允东;张兆杨 | 申请(专利权)人: | 上海大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/30;H04N13/00 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 视觉 感知 特性 指导 视点 视频 编码 量化 过程 方法 | ||
1.一种利用视觉感知特性指导多视点视频编码量化过程的方法,其特征在于操作步骤如下:
(1) 读取输入视频序列每一帧的亮度值大小,建立频域的恰可辨失真阈值模型,
(2) 输入视频序列每一帧经过视点内和视点间的预测,
(3) 对残差数据进行离散余弦变换,
(4) 动态调节当前帧中每个宏块的量化步长,
(5) 动态调节率失真优化过程中的拉格朗日参数,
(6) 对量化的数据进行熵编码,形成码流通过网络传输。
2.根据权利要求1所述的利用视觉感知特性指导多视点编码量化过程的方法,其特征在于所述步骤(1)读取输入视频序列每一帧的亮度值大小,建立频域的恰可辨失真阈值模型的操作步骤如下:
① 根据DCT变换的维数分别求出4x4和8x8DCT变换的空间灵敏度因子 ,其公式为:
其中s为控制参数,为DCT系数向量所代表的频率的角度,为DCT系数归一化因子,为空间频率,参数r,a,b和c根据DCT变换的大小不同而不同:对于8×8块尺寸的DCT编码格式,为0.6,为1.33,为0.11,为0.18;对于4×4块尺寸的DCT编码格式,为0.6,为0.8,为0.035,为0.008;
② 根据实验测得人眼在不同背景亮度条件下,亮度掩盖效应曲线表示如下:
其中,为当前编码块的平均像素值;
③ 利用边缘检测器检测当前编码块的纹理特性,求出纹理掩盖因子,其表达式如下:
其中,表示变换块的横纵坐标系数,表示对比掩盖估计因子,为空间灵敏度因子,为当前帧的第n个编码块的DCT变换系数;
④ 根据视频序列每帧中物体运动的快慢,实验测得时域掩盖效应因子表达式为:
其中,为空间频率,为时间频率;
⑤ 所述步骤①~④求得的四种因子的加权乘积即构成当前编码帧的恰可辨失真阈值。
3.根据权利要求1所述的利用视觉感知特性指导多视点编码量化过程的方法,其特征在于所述步骤(2)输入视频序列每一帧经过视点内和视点间的预测的操作步骤如下:
① 进行视点内的帧间和帧内预测,将预测值和当前要编码的帧进行比较,选取编码代价较小的一种编码方式;
② 进行视点间的预测,当前视点的当前编码帧根据参考视点的对应帧进行预测,将预测值和参考视点的对应帧进行比较,求得视点间预测的编码代价;
③ 比较视点间和视点内的编码代价,选择较小编码代价的那种预测模式。
4. 根据权利要求1所述的利用视觉感知特性指导多视点编码量化过程的方法,其特征在于所述步骤(3)对残差数据进行离散余弦变换的操作步骤如下:
① 编码块大小的判决,当编码块的任一边长小于8,则归类为4x4变换块,反之,则为8x8变换块;
② 当为4x4变换块,选择4x4 DCT变换,当为8x8变换块,选择8x8DCT变换。
5.根据权利要求1所述的利用视觉感知特性指导多视点编码量化过程的方法,其特征在于所述步骤(4)动态调节当前帧中每个宏块的量化步长的操作步骤如下:
① 计算当前帧的恰可辨失真阈值的平均值;
② 计算当前编码宏块的恰可辨失真阈值平均值;
③ 比较每帧的恰可辨失真阈值均值和当前宏块的恰可辨失真阈值的均值,动态调节当前宏块的量化步长,调节后的量化步长其表达式如下:
其中,表示编码框架原有量化步长,表示当前宏块的恰可辨失真阈值的均值,表示当前帧的恰可辨失真阈值的均值,为调节因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210402003.9/1.html,转载请声明来源钻瓜专利网。