[发明专利]使用深度生成性模型的视频压缩在审
| 申请号: | 202080020726.5 | 申请日: | 2020-03-19 |
| 公开(公告)号: | CN113574882A | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | A·哈比比安;T·S·科恩 | 申请(专利权)人: | 高通股份有限公司 |
| 主分类号: | H04N19/13 | 分类号: | H04N19/13;G06N3/08;H04N19/136;H04N19/90 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈炜;亓云 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 深度 生成 模型 视频压缩 | ||
本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括接收用于压缩的视频内容。一般通过自编码器将所接收的视频内容编码到隐代码空间中,该自编码器可由第一人工神经网络来实现。一般通过经训练的概率模型(经训练的概率模型可由第二人工神经网络实现)来生成经编码视频内容的经压缩版本,并且输出以供传输。
根据35 U.S.C.§119的优先权要求
本专利申请要求于2019年3月21日提交的题为“VIDEO COMPRESSION USING DEEPGENERATIVE MODELS(使用深度生成性模型的视频压缩)”的非临时申请No.16/360,458的优先权,该非临时申请已转让给其受让人并且由此通过援引被明确纳入于此。
公开领域
本公开一般涉及人工神经网络,尤其涉及使用人工神经网络来压缩视频内容。
相关技术描述
可包括一群互连的人工神经元(例如,神经元模型)的人工神经网络是一种计算设备或者表示由计算设备执行的方法。这些神经网络可被用于各种应用和/或设备,诸如网际协议(IP)相机、物联网(IoT)设备、自主交通工具、和/或服务机器人。
人工神经网络中的个体节点可以通过采取输入数据并且对该数据执行简单操作来模拟生物神经元。有选择地将对输入数据执行简单操作的结果传递给其他神经元。权重值与网络中的每个向量和节点相关联,并且这些值约束了输入数据如何与输出数据有关。例如,可以将每个节点的输入数据乘以对应的权重值,并且可将乘积求和。这些乘积的总和可由可任选的偏置进行调节,并且可将激活函数应用于结果,从而产生该节点的输出信号或“输出激活”。这些权重值最初可由通过网络的训练数据的迭代流来确定(例如,权重值是在训练阶段期间建立的,在该阶段中,该网络学习如何按特定类的典型输入数据特征来标识特定类)。
存在不同类型的人工神经网络,诸如递归神经网络(RNN)、多层感知器(MLP)神经网络、卷积神经网络(CNN)等。RNN按节省层的输出并且将该输出反馈到输入以帮助预测该层的结果的原理来工作。在MLP神经网络中,数据可被馈送到输入层,并且一个或多个隐藏层为该数据提供抽象程度。然后可以基于经抽象的数据在输出层上作出预测。MLP可特别适用于输入被指派类或标签的情况下的分类预测问题。卷积神经网络(CNN)是一种类型的前馈人工神经网络。卷积神经网络可包括人工神经元集合,其中每一个神经元具有感受野(例如,输入空间的空间局部化区域)并且共同地拼砌出一输入空间。卷积神经网络具有众多应用。具体而言,CNN已被广泛使用于模式识别和分类领域。
在分层神经网络架构中,第一层人工神经元的输出成为第二层人工神经元的输入,第二层人工神经元的输出成为第三层人工神经元的输入,依此类推。可以训练卷积神经网络来识别特征的阶层。卷积神经网络架构中的计算可分布在处理节点群体上,该处理节点群体可被配置在一个或多个计算链中。这些多层架构可每次训练一层并可使用后向传播来微调。
概述
本公开的某些方面涉及一种用于压缩视频的方法。该方法一般包括:接收供压缩的视频内容,通过由第一人工神经网络实现的自编码器将所接收的视频内容编码到隐代码空间中,通过由第二人工神经网络实现的概率模型生成经编码视频内容的经压缩版本,以及输出经编码视频内容的经压缩版本以供传输。
本公开的某些方面涉及一种用于压缩视频的系统。该系统包括至少一个处理器、以及耦合至该至少一个处理器的存储器。该至少一个处理器一般被配置成:接收供压缩的视频内容,通过由配置成在该至少一个处理器上执行的第一人工神经网络实现的自编码器将所接收的视频内容编码到隐代码空间中,通过由配置成在该至少一个处理器上执行的第二人工神经网络实现的概率模型生成经编码视频内容的经压缩版本,以及输出经编码视频内容的经压缩版本以供传输。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080020726.5/2.html,转载请声明来源钻瓜专利网。





