[发明专利]具有多个子流的多声道音频信号的有效编码和解码有效

专利信息
申请号: 201380025178.5 申请日: 2013-05-14
公开(公告)号: CN104285253B 公开(公告)日: 2017-05-17
发明(设计)人: H·姆恩特;J·瑞德米勒;K·J·罗尔登;M·沃德;P·威廉姆斯 申请(专利权)人: 杜比实验室特许公司;杜比国际公司
主分类号: G10L19/008 分类号: G10L19/008;G10L19/032;H04S3/00;G10L19/24
代理公司: 中国国际贸易促进委员会专利商标事务所11038 代理人: 宋岩
地址: 美国加*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 本文档涉及音频编码/解码。具体地,本文档涉及用于提高编码的多声道音频信号的质量的方法和系统。描述了配置为根据总的可用数据速率编码多声道音频信号的音频编码器。多声道音频信号能表示为用于根据基本声道配置呈现多声道音频信号的声道的基本组(121),并且能表示为声道的扩展组(122),该扩展组与基本组(121)相结合地用于根据扩展声道配置呈现多声道音频信号。基本声道配置与扩展声道配置彼此不同。
搜索关键词: 具有 个子 多声道 音频 信号 有效 编码 解码
【主权项】:
一种音频编码器,配置为根据总的可用数据速率编码多声道音频信号;其中多声道音频信号能表示为用于根据基本声道配置呈现多声道音频信号的声道的基本组,并且能表示为声道的扩展组,该扩展组与基本组相结合地用于根据扩展声道配置呈现多声道音频信号;其中基本声道配置与扩展声道配置彼此不同;该音频编码器包括‑基本编码器,配置为根据IS数据速率编码声道的基本组,由此产生独立子流,该独立子流被称为IS;‑扩展编码器,配置为根据DS数据速率编码声道的扩展组,由此产生从属子流,该从属子流被称为DS;及‑速率控制单元,配置为基于声道的基本组的瞬时IS编码质量指标并且基于声道的扩展组的瞬时DS编码质量指标来定期修改IS数据速率和DS数据速率,使得IS数据速率和DS数据速率的和基本上对应于总的可用数据速率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201380025178.5/,转载请声明来源钻瓜专利网。

同类专利
  • 信息处理装置、信息处理方法和程序-201880019499.7
  • 知念彻;辻实;山本优树 - 索尼公司
  • 2018-03-15 - 2019-11-12 - G10L19/008
  • 本技术涉及一种能够减少在发送多个音频对象的数据时要发送的数据量的信息处理装置、信息处理方法以及程序。根据本发明的一个方面的信息处理装置,针对多个假定收听位置中的预定的假定收听位置,将多个音频对象中具有在预定的假定收听位置处无法区分的声音的音频对象进行整合;并且,将由该合成的整合音频对象的数据,以及具有在预定的假定收听位置能够区分的声音的其它音频对象的数据一起发送。本技术可以应用于可以处理基于对象的音频数据的装置。
  • 用于增强的空间音频对象编码的装置及方法-201480041467.9
  • 于尔根·赫勒;艾德里安·穆尔塔扎;约尼·鲍卢斯;萨沙·迪克;哈拉尔德·福斯;奥立夫·赫尔穆特;法尔科·里德布施;里昂·特伦蒂夫 - 弗朗霍夫应用科学研究促进协会
  • 2014-07-17 - 2019-11-08 - G10L19/008
  • 提供一种用于生成一个或多个音频输出声道的装置。该装置包括:用于计算混合信息的参数处理器(110),以及用于生成一个或多个音频输出声道的降混合处理器(120)。降混合处理器(120)用于接收包括一个或多个音频传输声道的音频传输信号。一个或多个音频声道信号被混合在音频传输信号中,以及一个或多个音频对象信号被混合在音频传输信号中,且其中一个或多个音频传输声道的数目小于一个或多个音频声道信号的数目加上一个或多个音频对象信号的数目。参数处理器(110)用于接收指示一个或多个音频声道信号和一个或多个音频对象信号如何被混合在一个或多个音频传输声道中的信息的降混合信息,且其中参数处理器(110)用于接收协方差信息。此外,参数处理器(110)用于根据降混合信息以及根据协方差信息,计算混合信息。降混合处理器(120)用于根据混合信息,从音频传输信号生成一个或多个音频输出声道。协方差信息指示用于一个或多个音频声道信号中的至少一个的水平差信息,并进一步指示用于一个或多个音频对象信号中的至少一个的水平差信息。然而,协方差信息并不指示用于任意一对的一个或多个音频声道信号中的一个和一个或多个音频对象信号中的一个的相关性信息。
  • 多声道音频内容的编码和解码-201480050044.3
  • H·普恩哈根;H·默德;K·克约尔林 - 杜比国际公司
  • 2014-09-08 - 2019-10-29 - G10L19/008
  • 提供了用于对多声道音频内容进行编码和解码以供在具有N个声道的扬声器配置上回放的解码和编码方法。该解码方法包括:在第一解码模块中将M个输入音频信号解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号;并且对于所述N个声道中的超过M个声道的每一个,接收与所述M个中间信号中的一个对应的另外的输入音频信号,以及对输入音频信号及其对应的中间信号进行解码以便产生立体声信号,该立体声信号包括适合于在扬声器配置的N个声道中的两个上回放的第一音频信号和第二音频信号。
  • 产生HOA信号的混合的空间/系数域表示的方法和设备-201480038940.8
  • 斯文·科登;亚历山大·克鲁格 - 杜比国际公司
  • 2014-06-24 - 2019-10-22 - G10L19/008
  • 存在针对被称为HOA的高阶Ambisonics的两种表示:空间域和系数域。本发明从HOA信号的系数域表示产生混合的空间/系数域表示,其中,所述HOA信号的数目是可变的。系数域信号的矢量被分离为具有常数个HOA系数的系数域信号的矢量和具有可变数目的HOA系数的系数域信号的矢量。常数个HOA系数矢量被变换为相应的空间域信号矢量。为了便于高质量编码,在不产生信号不连续性的情况下,对系数域信号的可变数目的HOA系数矢量进行自适应归一化,并将其与空间域信号的矢量复用。
  • 改进解码用实际三维声内容的子频带中的处理-201780079018.7
  • 马修·巴奎;亚历山大·格汗 - 奥兰治公司
  • 2017-12-15 - 2019-10-01 - G10L19/008
  • 本发明涉及一种由计算机装置实施,用于处理包括定义一系列三维声频道的多阶的多个三维声分量的三维声内容的方法,其中每个三维声频道都表示三维声分量,方法包括:‑在多个频带中三维声分量的频率过滤,‑编译三维声解码矩阵(B),‑处理三维声解码矩阵(B),以通过矩阵尺寸缩减,提取每个与三维声阶和三维声阶用频带相关的多个三维声解码子矩阵(B1,B2)‑解码子矩阵于每个被选择频带中三维声分量的分别应用,以及所述相应应用结果的逐带重构,以传输多个解码的信号,每个解码的信号与声源相关。
  • 用于编码和解码音频信号的方法和装置-201480032227.2
  • 彼得·加克斯;亚历山大·库鲁格尔 - 杜比国际公司
  • 2014-05-27 - 2019-10-01 - G10L19/008
  • 本发明介绍了对HOA内容进行分层编码的新概念。用于编码分层音频比特流的方法包括:将HOA输入信号渲染为环绕立体声,编码环绕立体声以用于基础层输出信号,解码经编码的环绕立体声以获得经重建的环绕立体声信号,对所接收的HOA输入信号执行维度降低,计算经维度降低的HOA信号和经重建的环绕立体声信号之间的残差,编码该残差信号,以及将关于HOA输入信号的结构信息、经编码的残差和经编码的环绕立体声多路复用为比特流以获得分层音频比特流。
  • 用于音频信号的参数重建的去相关器结构-201480056084.9
  • L·维尔莫斯;T·赫冯恩;H·普恩哈根 - 杜比国际公司
  • 2014-10-21 - 2019-09-20 - G10L19/008
  • 编码系统将数个音频信号(X)与湿上混系数和干上混系数(P,C)一起编码为下混信号(Y)。在解码系统中,预乘法器(101)通过根据第一组系数(Q)线性映射下混信号计算中间信号(W);去相关部(102)基于中间信号输出去相关信号(Z);湿上混部(103)通过根据湿上混系数线性映射去相关信号计算湿上混信号;干上混部(104)通过根据干上混系数线性映射下混信号计算干上混信号;组合部(105)通过组合湿上混信号和干上混信号提供多维重建信号(X);并且转换器(106)基于湿上混系数和干上混系数计算第一组系数并且将其供给到预乘法器。
  • 立体声音频信号编码器-201880009084.1
  • A·瓦西拉凯 - 诺基亚技术有限公司
  • 2018-01-03 - 2019-09-13 - G10L19/008
  • 一种方法,包括:接收至少两个音频通道信号;针对第一帧,确定表示至少两个通道音频信号之间的差异的至少两个参数;标量量化所述至少两个参数以生成至少两个索引值;对至少两个参数的初始标量量化参数进行自适应编码;确定初始标量量化参数是否具有与预定值不同的值;如果初始标量量化参数具有与预定值不同的值,则对任何未编码的标量量化参数进行自适应编码;如果初始标量量化参数具有等于预定值的值,则确定至少两个标量量化参数是否全部具有等于预定值的值;如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数中的至少一个具有与预定值不同的值,则对任何未编码的标量量化参数进行自适应编码,并生成指示输出是固定速率编码或可变速率编码中的一个的指示符;如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数全部具有等于预定值的值,则生成指示输出是固定速率编码或可变速率编码中的另一个的指示符;根据至少两个参数,生成至少两个音频通道信号的单声道表示;以及对单声道表示进行编码。
  • 高效率对象元数据编码的装置及方法-201480041458.X
  • 克里斯蒂安·鲍斯;克里斯蒂安·埃特尔 - 弗朗霍夫应用科学研究促进协会
  • 2014-07-16 - 2019-08-23 - G10L19/008
  • 提供了一种用于产生至少一个音频声道的装置(100)。装置(100)包含用于接收至少一个压缩元数据信号的元数据解码器(110)。每一压缩元数据信号包含多个第一元数据样本。每一压缩元数据信号的第一元数据样本指示与至少一个音频对象信号中的音频对象信号相关联的信息。元数据解码器(110)用于产生至少一个重建元数据信号,使得每一重建元数据信号包含至少一个压缩元数据信号中的一个压缩元数据信号的第一元数据样本以及进一步包含多个第二元数据样本。而且,元数据解码器(110)根据重建元数据信号的至少两个第一元数据样本来产生每一重建元数据信号的每一第二元数据样本。而且,装置(100)包含音频声道发生器(120),其根据至少一个音频对象信号以及至少一个重建元数据信号而产生至少一个音频声道。此外,提供了一种用于产生编码音频信息的装置,编码音频信息包含至少一个编码音频信号以及至少一个压缩元数据信号。
  • 适配用于终端用户自由视点监控的分布式音频录制-201780081921.7
  • S·S·马特;L·拉克索南 - 诺基亚技术有限公司
  • 2017-12-27 - 2019-08-16 - G10L19/008
  • 通过分布式麦克风在多个音频信道中捕获音频场景。基于用户的视点和用户的至少一个偏好中的至少一个,从这些多个音频信道中选择(400、500)这些多个音频信道中的两个或更多个音频信道;基于用户的偏好、用户操作的设备(700)的软件应用的要求以及设备的操作条件的要求中的至少一个,对所选择的两个或更多个音频信道进行优先级排序(500、600)。在优先级排序(500、600)之后,将所选择的两个或更多个音频信道中的至少一个编码(600)成通过传输链路发送给设备(700)的编码监控混音(610‑1)。
  • 音频编码系统、用于产生比特流的方法以及音频解码器-201480010021.X
  • T·弗瑞尔德里驰;A·米勒;K·林泽梅儿;C-C·司鹏格尔;T·R·万格布拉斯 - 杜比国际公司
  • 2014-02-21 - 2019-08-13 - G10L19/008
  • 本文档涉及音频编码系统。具体地说,本文档涉及用于参数化多声道音频编码的高效方法和系统。描述了音频编码系统(500),其被配置为产生指示下混信号和空间元数据的比特流(564),所述空间元数据用于从下混信号产生多声道上混信号。系统(500)包括下混处理单元(510),其被配置为从多声道输入信号(561)产生下混信号;其中,下混信号包括m个声道,并且其中,多声道输入信号(561)包括n个声道;n、m是整数,其中,m<n。此外,系统(500)包括参数处理单元(520),其被配置为从多声道输入信号(561)确定空间元数据。另外,系统(500)包括配置单元(540),其被配置为基于一个或多个外部设置确定对于参数处理单元(520)的一个或多个控制设置;其中,所述一个或多个外部设置包括比特流(564)的目标数据速率,并且其中,所述一个或多个控制设置包括空间元数据的最大数据速率。
  • 时间偏移估计-201680072462.1
  • V·S·C·S·奇比亚姆;V·阿提 - 高通股份有限公司
  • 2016-12-09 - 2019-08-13 - G10L19/008
  • 本发明描述一种使信道非因果地移位的方法,其包含在编码器处估计比较值。每一比较值指示经先前捕获参考信道与对应经先前捕获目标信道之间的时间失配的量。所述方法还包含基于历史比较值数据及平滑参数来使所述比较值平滑以产生经平滑比较值。所述方法进一步包含基于所述经平滑比较值来估计暂定移位值。所述方法还包含使目标信道非因果地移位非因果移位值以产生与参考信道时间地对准的经调整目标信道。所述非因果移位值是基于所述暂定移位值。所述方法进一步包含基于参考信道及所述经调整目标信道来产生中频带信道或边频带信道中的至少一者。
  • 用于联合多声道编码的方法和设备-201480050053.2
  • K·克约尔林;H·默德;H·普恩哈根 - 杜比国际公司
  • 2014-09-08 - 2019-07-16 - G10L19/008
  • 公开了用于编码具有至少四个声道的音频系统的声道的编码和解码设备。解码设备具有使第一对输入声道经历第一立体声解码的第一立体声解码组件,以及使第二对输入声道经历第二立体声解码的第二立体声解码组件。第一和第二立体声解码组件的结果被交叉耦合到第三和第四立体声解码组件,第三和第四立体声解码组件中的每一个在从第一立体声解码组件得到的一个声道和从第二立体声解码组件得到的一个声道上执行立体声解码。
  • 用于对三维音频信号进行转换、立体声编码、解码和转码的过程-201780051834.7
  • B·贝纳德;F·贝克尔 - 冠状编码股份有限公司
  • 2017-09-28 - 2019-05-21 - G10L19/008
  • 本发明题为“用于对三维音频信号进行转换、立体声编码、解码和转码的过程”。本发明涉及对声学场、更具体地讲是一阶高保真度立体声响复制三维声学场进行转换、编码、解码和转码的方法,包括至少一种用于将所述声学场转换成球形场的方法、用于将所述球形场编码成立体声信号的方法、用于将立体声信号解码到球形场中的方法、或者用于将所述球形场转码成任何音频格式的方法。用于将高保真度立体声响复制声学场编码成球形场的方法在频域中执行将所述声学场分成三个分量,任选地分成两个分量,并且将所述分量分组到全球形场中。用于将所述球形场编码成立体声信号的方法在频域中执行全景和相位差值的确定、通道间域中相位差奇点的确定、通道间域中相位对应函数的确定、以及立体声形式的经编码信号的左分量和右分量的计算。球坐标任选地以仿射方式修改,以对应于左通道和右通道的标准几何布置。用于在球形场中解码的方法适用于任何立体声信号,尤其适用于通过所述编码方法获得的立体声信号。所述用于在球形场中解码的方法在频域中执行全景和相位差的确定;通道间域中相位差奇点的新位置的确定,所述位置随时间而变化;通道间域中相位对应函数的确定;对应于所期望球形场的复系数的确定;和所述球形场中原点方向的确定,所述方向任选地以仿射方式修改以对应于左通道和右通道的标准几何布置。所述用于从立体声信号进行转码的方法包括所述用于解码到球形场中的方法,然后包括提供球形场到给定音频全景定律上的投影的方法、或双耳化方法。
  • 音频解码系统和音频编码系统-201480050422.8
  • 拉尔斯·维尔默斯;利夫·约纳什·萨穆埃尔松;克里斯托弗·薛林;海科·普尔哈根;利夫·塞尔斯特伦 - 杜比国际公司
  • 2014-09-08 - 2019-04-30 - G10L19/008
  • 用于处理双通道输入信号(X)的音频解码系统(100)包括参数混合级(110)。参数混合级接收双通道输入信号和一组混合参数(P1),并且输出双通道输出信号(Y1)。参数混合级包括基于输入信号输出去相关信号(D1)的去相关级(111)。参数混合级还包括混合矩阵(112),其接收输入信号和去相关信号,并且形成来自输入信号和去相关信号的通道的双通道线性组合。混合矩阵输出该线性组合作为双通道输出信号。能够由该组混合参数来控制该线性组合的系数,并且该组中的至少四个混合参数能够被独立地指定。在示例实施方式中,多个参数混合级被用来独立地重构被编码在输入信号中的附加通道。
  • 变换球谐系数-201480011287.6
  • 迪潘让·森;马丁·詹姆斯·莫雷尔;尼尔斯·京特·彼得斯 - 高通股份有限公司
  • 2014-02-28 - 2019-04-09 - G10L19/008
  • 一般来说,本发明描述一种用于变换球谐系数的技术。一种包含一或多个处理器的装置可执行所述技术。所述处理器可经配置以:解析所述位流以确定变换信息,所述变换信息描述如何变换声场以减少提供与描述所述声场相关的信息的多个阶层元素的数目。所述处理器可进一步经配置以:当基于提供与描述所述声场相关的信息的所述多个阶层元素中的那些阶层元素来重现所述声场时,基于所述变换信息来变换所述声场以反转为减少所述多个阶层元素的所述数目所执行的所述变换。
  • 增强一阶高保真度立体声响复制信号的方向性的方法和装置-201480015676.6
  • J.贝姆 - 杜比国际公司
  • 2014-03-17 - 2019-03-22 - G10L19/008
  • 来自提供被称为B格式信号的一阶高保真度立体声响复制信号的麦克风的记录提供对声音方向性的有限认知。声源被感知为比它们实际的更宽,特别是对于偏离中心的收听位置,并且声源往往被定位成来自最靠近的扬声器位置。在增强一阶高保真度立体声响复制信号的方向性的方法和装置中,从较低阶高保真度立体声响复制输入信号(10)提取(SFA)另外的方向性信息(22,23)。使用另外的方向性信息来估计更高阶高保真度立体声响复制系数(25a),然后将其与输入信号的系数结合(CS)。从而增强高保真度立体声响复制信号的方向性,这在将高保真度立体声响复制信号解码成大声扬声器信号时得到空间源定位的增加的精确度。得到的输出信号具有比输入信号更多的能量。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top