[发明专利]运动矢量自动生成的视频编解码系统有效
| 申请号: | 201710267434.1 | 申请日: | 2017-04-21 |
| 公开(公告)号: | CN107105278B | 公开(公告)日: | 2019-10-25 |
| 发明(设计)人: | 陈志波 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | H04N19/513 | 分类号: | H04N19/513;H04N19/176 |
| 代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 运动 矢量 自动 生成 视频 解码 框架 | ||
本发明公开了一种运动矢量自动生成的视频编解码框架,无需进行运动矢量预测和运动矢量编码传输,其包括:编码端与解码端;其中:所述编码端,根据当前参考帧的视频数据内容,并基于通过学习的方法构建的像素级的运动光场矢量生成网络,来预测当前帧视频像素的光流信息,再结合输入的块模式信息计算对应块的运动矢量,最终将编码的残差信息传输至解码端;所述解码端,对残差信息进行解码,获得重构参考帧数据,并采用与编码端相同的方法获得每一重构参考帧数据的运动矢量,再进行视频数据重建。由于该编码框架无需进行运动矢量搜索和运动矢量编码传输,从而降低编码复杂度和提升编码效率。
技术领域
本发明涉及视频编码技术领域,尤其涉及一种运动矢量自动生成的视频编解码系统。
背景技术
作为现有视频编码标准的核心框架,混合视频编码(HVC-Hybrid Video Coding)框架是一种混合时间空间视频压缩方案,即先用帧间预测编码消除时间域的相关性,然后对残差进行变换编码,消除空间相关性,最后进行熵编码去除统计上的冗余度。其中帧间预测编码可以有效去除视频信号在时间域的冗余度,极大地提升视频编码效率。自80年代帧间运动预测编码方式被H.261标准采纳被延续至今。
在现有的H.264,HEVC等视频编码标准中采用了更为复杂的运动预测模式,包括更多的预测参考帧、更多的预测块模式、更多的运动矢量预测编码模式等等,无论是从运动矢量预测的复杂度还是运动矢量本身编码传输的数据量比例都是很高的。
鉴于此,有必要进行深入研究,使得编码框架中既可以避免复杂的运动矢量搜索,又可以节约运动矢量的传输数据量。
发明内容
本发明的目的是提供一种运动矢量自动生成的视频编解码系统,无需进行运动矢量预测和运动矢量编码传输,从而降低编码复杂度和提升编码效率。
本发明的目的是通过以下技术方案实现的:
一种运动矢量自动生成的视频编解码系统,无需进行运动矢量预测和运动矢量编码传输,其包括:编码端与解码端;其中:
所述编码端,根据当前参考帧的视频数据内容,并基于通过学习的方法构建的像素级的运动光场矢量生成网络,来预测当前帧视频像素的光流信息,再结合输入的块模式信息计算对应编码块的运动矢量,然后,进行运动补偿并计算残差,最终将编码的残差信息传输至解码端;
所述解码端,将已经解码的视频帧作为输入,并采用与编码端相同的方法预测相应的光流信息,进而获得对应解码块的运动矢量,再利用接收到的残差信息重建视频帧。
所述通过学习的方法构建的像素级的运动光场矢量生成网络包括:
建立包含多种视频内容类型、运动过程和不同压缩程度的视频数据的数据集;计算每一视频数据的光流信息作为训练样本的标签;
构建神经网络,并以重建生成的当前重构参考帧作为经网络输入进行前向传播预测光流信息,并根据训练样本标签计算损失值,再根据损失值反向传播更新参数,如此反复迭代多次作为神经网络训练过程,训练完成的网络作为像素级的运动光场矢量生成网络。
所构建的神经网络结构为:依次设置的卷积层、池化层、局部响应归一化层、全连接层以及空间Softmax层;或者,依次设置的卷积层、池化层、卷积层、反卷积层、剪裁层以及Softmax层。
所述编码端中运动矢量的计算公式为:
其中,为第i个块模式信息对应的光流信息,N的大小由块模式信息决定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710267434.1/2.html,转载请声明来源钻瓜专利网。





