[发明专利]一种基于神经网络的视频编码方法及系统有效
| 申请号: | 202010305191.8 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111464815B | 公开(公告)日: | 2021-04-23 |
| 发明(设计)人: | 刘东;林建平;李厚强;吴枫 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | H04N19/70 | 分类号: | H04N19/70;H04N19/51;G06N3/08;G06N3/04 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 神经网络 视频 编码 方法 系统 | ||
1.一种基于神经网络的视频编码方法,其特征在于,包括:
获取用于训练神经网络的视频数据;
构建一个含有多参考帧的神经网络;
所述构建一个含有多参考帧的神经网络,包括:构建用于计算当前帧和前一重建帧之间的运动场的运动估计模块;构建用于从前若干重建运动场预测当前帧对应的运动场的运动预测模块;构建用于对原始运动场残差进行编码的运动差编码模块,以及用于对原始运动场残差进行解码的运动差解码模块;构建用于获得重建运动场的运动重建模块;构建用于获得当前帧的预测的运动补偿模块;构建用于对原始残差进行编码的残差编码模块,以及用于对原始残差进行解码的残差解码模块;构建用于获得重建帧的帧重建模块;
基于所述视频数据对所述含有多参考帧的神经网络进行训练,得到训练好的神经网络;
基于所述训练好的神经网络对视频进行编码。
2.根据权利要求1所述的方法,其特征在于,所述构建一个含有多参考帧的神经网络,包括:
构建用于计算当前帧和前一重建帧之间的运动场的运动估计模块;
构建用于从前若干重建运动场预测当前帧对应的运动场的运动预测模块;
构建用于对原始运动场残差进行编码的运动差编码模块,以及用于对原始运动场残差进行解码的运动差解码模块;
构建用于获得重建运动场的运动重建模块;
构建用于改善重建运动场的运动场改善模块;
构建用于获得当前帧的预测的运动补偿模块;
构建用于对原始残差进行编码的残差编码模块,以及用于对原始残差进行解码的残差解码模块;
构建用于获得重建帧的帧重建模块。
3.根据权利要求1所述的方法,其特征在于,所述构建一个含有多参考帧的神经网络,包括:
构建用于计算当前帧和前一重建帧之间的运动场的运动估计模块;
构建用于从前若干重建运动场预测当前帧对应的运动场的运动预测模块;
构建用于对原始运动场残差进行编码的运动差编码模块,以及用于对原始运动场残差进行解码的运动差解码模块;
构建用于获得重建运动场的运动重建模块;
构建用于改善重建运动场的运动场改善模块;
构建用于获得当前帧的预测的运动补偿模块;
构建用于对原始残差进行编码的残差编码模块,以及用于对原始残差进行解码的残差解码模块;
构建用于改善重建残差的残差改善模块;
构建用于获得重建帧的帧重建模块。
4.根据权利要求1所述的方法,其特征在于,所述基于所述视频数据对所述含有多参考帧的神经网络进行训练,得到训练好的神经网络,包括:
基于所述视频数据,采用渐进式训练方法在训练集上训练所述含有多参考帧的神经网络,得到训练好的神经网络。
5.一种基于神经网络的视频编码系统,其特征在于,包括:
获取单元,用于获取用于训练神经网络的视频数据;
构建单元,用于构建一个含有多参考帧的神经网络;
所述构建单元具体用于:构建用于计算当前帧和前一重建帧之间的运动场的运动估计模块;构建用于从前若干重建运动场预测当前帧对应的运动场的运动预测模块;构建用于对原始运动场残差进行编码的运动差编码模块,以及用于对原始运动场残差进行解码的运动差解码模块;构建用于获得重建运动场的运动重建模块;构建用于获得当前帧的预测的运动补偿模块;构建用于对原始残差进行编码的残差编码模块,以及用于对原始残差进行解码的残差解码模块;构建用于获得重建帧的帧重建模块;
训练单元,用于基于所述视频数据对所述含有多参考帧的神经网络进行训练,得到训练好的神经网络;
编码单元,用于基于所述训练好的神经网络对视频进行编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010305191.8/1.html,转载请声明来源钻瓜专利网。





