[发明专利]通过可变形卷积生成用于视频编解码的预测帧在审
| 申请号: | 202180005733.2 | 申请日: | 2021-06-10 |
| 公开(公告)号: | CN114503576A | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 蒋薇;王炜;丁鼎;刘杉 | 申请(专利权)人: | 腾讯美国有限责任公司 |
| 主分类号: | H04N19/40 | 分类号: | H04N19/40 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 李华;王琦 |
| 地址: | 美国加利福尼亚州*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通过 变形 卷积 生成 用于 视频 解码 预测 | ||
1.一种在视频编解码设备处进行视频编解码的方法,其特征在于,包括:
通过可变形卷积深度神经网络DNN执行可变形卷积,以基于一组一个或多个先前已重建参考帧,生成一个或多个第一特征图;
基于所述一个或多个第一特征图,生成预测帧;以及
基于所述预测帧,重建当前帧。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于特征提取DNN,生成对应于所述一个或多个先前已重建参考帧的一组一个或多个第二特征图;以及
使用偏移生成DNN,分别生成对应于所述一个或多个第二特征图的一个或多个偏移图,每个偏移图是基于所述偏移生成DNN的以下输入而生成的:
对应于正在生成的所述偏移图的第二特征图,以及
对应于目标帧的第二特征图,所述目标帧是所述一个或多个先前已重建参考帧其中之一,其中,所述一个或多个偏移图具有相同的目标帧。
3.根据权利要求2所述的方法,其特征在于,当所述当前帧与所述一个或多个先前已重建参考帧是按显示顺序排列时,所述目标帧与所述当前帧相邻。
4.根据权利要求2所述的方法,其特征在于,当所述当前帧是P帧时,所述目标帧是所述一个或多个先前已重建参考帧中的最后一帧;并且
当所述当前帧是B帧时,所述目标帧是所述一个或多个先前已重建参考帧中按显示顺序在所述当前帧之前的帧中的最后一帧。
5.根据权利要求2所述的方法,其特征在于,所述通过可变形卷积DNN执行可变形卷积,以生成一个或多个第一特征图包括:
接收所述一个或多个第二特征图,作为所述可变形卷积DNN的输入;以及
分别生成对应于所述一个或多个第二特征图的所述一个或多个第一特征图。
6.根据权利要求5所述的方法,其特征在于,所述可变形卷积DNN包括一个或多个可变形卷积层,每个可变形卷积层与一个可变形卷积内核相关联,并且
在对应于每个第二特征图的所述一个或多个可变形卷积层其中之一层,基于相应的可变形卷积内核和相应的第二特征图的偏移图,执行可变形卷积。
7.根据权利要求1所述的方法,其特征在于,所述基于所述一个或多个第一特征图,生成预测帧包括:
基于所述一个或多个第一特征图和所述一个或多个先前已重建参考帧,使用帧重建DNN重建一个或多个已对准帧;以及
基于所述一个或多个已对准帧,使用帧合成DNN生成所述预测帧。
8.根据权利要求1所述的方法,其特征在于,还包括:
用四维4D张量作为输入,使用特征提取DNN生成4D特征张量,所述4D张量由所述一组一个或多个先前已重建参考帧形成,每个帧包括多个信道。
9.根据权利要求8所述的方法,其特征在于,所述通过可变形卷积DNN执行可变形卷积,以生成一个或多个第一特征图包括:
接收所述4D特征张量,作为所述可变形卷积DNN的输入;以及
生成融合的已对准特征图。
10.根据权利要求9所述的方法,其特征在于,所述可变形卷积DNN包括一个或多个3D可变形卷积层,每个3D可变形卷积层与一个3D可变形卷积内核和一个3D偏移图相关联,并且在所述一个或多个可变形卷积层其中之一层,基于相应的3D可变形卷积内核和相应的3D偏移图,执行3D可变形卷积。
11.根据权利要求9所述的方法,其特征在于,还包括:
用所述融合的已对准特征图作为帧重建DNN的输入,使用所述帧重建DNN生成所述预测帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180005733.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扩散匀化装置
- 下一篇:用于无人机系统通信的系统和方法





