[发明专利]使用深度生成性模型的视频压缩在审
| 申请号: | 202080020806.0 | 申请日: | 2020-03-23 |
| 公开(公告)号: | CN113574883A | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | A·哈比比安;T·J·范罗森达尔;T·S·科恩 | 申请(专利权)人: | 高通股份有限公司 |
| 主分类号: | H04N19/13 | 分类号: | H04N19/13;G06N3/08;H04N19/20;H04N19/136;H04N19/90;H04N19/186 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 姚丹红;陈炜 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 深度 生成 模型 视频压缩 | ||
本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括:接收供压缩的视频内容。所接收的视频内容一般通过可由第一人工神经网络实现的编码器被编码到隐性码空间中。经编码视频内容的经压缩版本一般通过可由第二人工神经网络实现的经训练概率性模型来生成并输出以供传输。
相关申请的交叉引用
本申请要求于2019年3月21日提交的题为“Video Compression Using DeepGenerative Models(使用深度生成性模型的视频压缩)”且被转让给本申请受让人的美国临时专利申请S/N.62/821,778的权益,该临时专利申请的内容藉此通过援引全部纳入于此。
公开领域
本公开一般涉及人工神经网络,尤其涉及使用人工神经网络来压缩视频内容。
相关技术描述
可包括一群互连的人工神经元(例如,神经元模型)的人工神经网络是一种计算设备或者表示由计算设备执行的方法。这些神经网络可被用于各种应用和/或设备,诸如网际协议(IP)相机、物联网(IoT)设备、自主交通工具、和/或服务机器人。
人工神经网络中的个体节点可通过取得输入数据并对数据执行简单运算来模仿生物神经元。对输入数据执行的简单运算的结果被选择性地传递给其他神经元。权重值与网络中的每个向量和节点相关联,并且这些值约束输入数据如何与输出数据相关。例如,每个节点的输入数据可乘以相应的权重值,并且可对乘积求和。这些乘积的总和可通过可任选的偏置进行调整,并且可将激活函数应用于结果,从而产生节点的输出信号或“输出激活”。权重值可初始地由训练数据在网络中的迭代流动来确定(例如,权重值在训练阶段期间确立,在该阶段中网络学习如何通过各类别的典型输入数据特性来标识特定类别)。
存在不同类型的人工神经网络,诸如递归神经网络(RNN)、多层感知器(MLP)神经网络、卷积神经网络(CNN)等。RNN的工作原理是保存一层的输出并将该输出反馈回到输入以帮助预测该层的结果。在MLP神经网络中,数据可被馈送到输入层中,并且一个或多个隐藏层提供对数据的若干级别的抽象。随后可基于经抽象数据来对输出层作出预测。MLP可以特别适合于分类预测问题,其中输入被指派类或标签。卷积神经网络(CNN)是一种前馈人工神经网络。卷积神经网络可包括人工神经元的集合,这些人工神经元各自具有感受野(例如,输入空间的空间局部区域)并且共同地拼出一输入空间。卷积神经网络具有众多应用。具体而言,CNN已被广泛使用于模式识别和分类领域。
在分层神经网络架构中,第一层人工神经元的输出成为第二层人工神经元的输入,第二层人工神经元的输出成为第三层人工神经元的输入,依此类推。可以对卷积神经网络进行训练以识别特征阶层。卷积神经网络架构中的计算可分布在处理节点群体上,其可被配置在一个或多个计算链中。这些多层架构可每次训练一层并可使用反向传播来微调。
概述
本公开的某些方面涉及一种用于压缩视频的方法。该方法一般包括:接收供压缩的视频内容;通过由第一人工神经网络实现的编码器将所接收的视频内容编码到隐性码空间中,该编码至少部分地基于与所接收的视频内容有关的信息;通过由第二人工神经网络实现的概率性模型来生成经编码视频内容的经压缩版本;以及输出该经编码视频内容的该经压缩版本以供传输。
本公开的某些方面涉及一种用于压缩视频的系统。该系统包括至少一个处理器、以及耦合到该至少一个处理器的存储器。该至少一个处理器一般被配置成:接收供压缩的视频内容;通过由第一人工神经网络实现的编码器将所接收的视频内容编码到隐性码空间中,该编码至少部分地基于与所接收的视频内容有关的信息;通过由第二人工神经网络实现的概率性模型来生成经编码视频内容的经压缩版本;以及输出该经编码视频内容的该经压缩版本以供传输。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080020806.0/2.html,转载请声明来源钻瓜专利网。





