[发明专利]具有多个子流的多声道音频信号的有效编码和解码有效

申请号：	201380025178.5	申请日：	2013-05-14
公开（公告）号：	CN104285253B	公开（公告）日：	2017-05-17
发明（设计）人：	H·姆恩特;J·瑞德米勒;K·J·罗尔登;M·沃德;P·威廉姆斯	申请（专利权）人：	杜比实验室特许公司;杜比国际公司
主分类号：	G10L19/008	分类号：	G10L19/008;G10L19/032;H04S3/00;G10L19/24
代理公司：	中国国际贸易促进委员会专利商标事务所11038	代理人：	宋岩
地址：	美国加***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	本文档涉及音频编码/解码。具体地，本文档涉及用于提高编码的多声道音频信号的质量的方法和系统。描述了配置为根据总的可用数据速率编码多声道音频信号的音频编码器。多声道音频信号能表示为用于根据基本声道配置呈现多声道音频信号的声道的基本组(121)，并且能表示为声道的扩展组(122)，该扩展组与基本组(121)相结合地用于根据扩展声道配置呈现多声道音频信号。基本声道配置与扩展声道配置彼此不同。
搜索关键词：	具有个子多声道音频信号有效编码解码
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种音频编码器，配置为根据总的可用数据速率编码多声道音频信号；其中多声道音频信号能表示为用于根据基本声道配置呈现多声道音频信号的声道的基本组，并且能表示为声道的扩展组，该扩展组与基本组相结合地用于根据扩展声道配置呈现多声道音频信号；其中基本声道配置与扩展声道配置彼此不同；该音频编码器包括‑基本编码器，配置为根据IS数据速率编码声道的基本组，由此产生独立子流，该独立子流被称为IS；‑扩展编码器，配置为根据DS数据速率编码声道的扩展组，由此产生从属子流，该从属子流被称为DS；及‑速率控制单元，配置为基于声道的基本组的瞬时IS编码质量指标并且基于声道的扩展组的瞬时DS编码质量指标来定期修改IS数据速率和DS数据速率，使得IS数据速率和DS数据速率的和基本上对应于总的可用数据速率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司，未经杜比实验室特许公司;杜比国际公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201380025178.5/，转载请声明来源钻瓜专利网。

同类专利

信息处理装置、信息处理方法和程序-201880019499.7
发明人：知念彻;辻实;山本优树 -专利权人：索尼公司
申请日： 2018-03-15 - 公布日： 2019-11-12 - 主分类号： G10L19/008
摘要：本技术涉及一种能够减少在发送多个音频对象的数据时要发送的数据量的信息处理装置、信息处理方法以及程序。根据本发明的一个方面的信息处理装置，针对多个假定收听位置中的预定的假定收听位置，将多个音频对象中具有在预定的假定收听位置处无法区分的声音的音频对象进行整合；并且，将由该合成的整合音频对象的数据，以及具有在预定的假定收听位置能够区分的声音的其它音频对象的数据一起发送。本技术可以应用于可以处理基于对象的音频数据的装置。

用于增强的空间音频对象编码的装置及方法-201480041467.9
发明人：于尔根·赫勒;艾德里安·穆尔塔扎;约尼·鲍卢斯;萨沙·迪克;哈拉尔德·福斯;奥立夫·赫尔穆特;法尔科·里德布施;里昂·特伦蒂夫 -专利权人：弗朗霍夫应用科学研究促进协会
申请日： 2014-07-17 - 公布日： 2019-11-08 - 主分类号： G10L19/008
摘要：提供一种用于生成一个或多个音频输出声道的装置。该装置包括：用于计算混合信息的参数处理器(110)，以及用于生成一个或多个音频输出声道的降混合处理器(120)。降混合处理器(120)用于接收包括一个或多个音频传输声道的音频传输信号。一个或多个音频声道信号被混合在音频传输信号中，以及一个或多个音频对象信号被混合在音频传输信号中，且其中一个或多个音频传输声道的数目小于一个或多个音频声道信号的数目加上一个或多个音频对象信号的数目。参数处理器(110)用于接收指示一个或多个音频声道信号和一个或多个音频对象信号如何被混合在一个或多个音频传输声道中的信息的降混合信息，且其中参数处理器(110)用于接收协方差信息。此外，参数处理器(110)用于根据降混合信息以及根据协方差信息，计算混合信息。降混合处理器(120)用于根据混合信息，从音频传输信号生成一个或多个音频输出声道。协方差信息指示用于一个或多个音频声道信号中的至少一个的水平差信息，并进一步指示用于一个或多个音频对象信号中的至少一个的水平差信息。然而，协方差信息并不指示用于任意一对的一个或多个音频声道信号中的一个和一个或多个音频对象信号中的一个的相关性信息。

用于对降混合矩阵解码及编码的方法、编码器及解码器-201480057957.8
发明人：弗洛林·基多;阿希姆·孔茨;伯恩哈德·格里尔 -专利权人：弗朗霍夫应用科学研究促进协会
申请日： 2014-10-13 - 公布日： 2019-11-08 - 主分类号： G10L19/008
摘要：描述一种方法，该方法对用于将音频内容的多个输入声道(300)映射至多个输出声道(302)的降混合矩阵(306)进行解码，输入及输出声道(300，302)与位于相对于收听者位置的预定位置处的各个扬声器相关联，其中通过利用多个输入声道(300)的扬声器对(S₁‑S₉)的对称性以及多个输出声道(302)的扬声器对(S₁₀‑S₁₁)的对称性对降混合矩阵(306)进行编码。对表示经编码的降混合矩阵(306)的经编码的信息进行接收并解码以获得经解码的降混合矩阵(306)。

用于降低去相关器电路中瞬态信号的时间伪差的系统和方法-201480042558.4
发明人： D·J·布瑞巴特;芦烈;A·玛蒂奥斯索尔;N·R·青格斯 -专利权人：杜比实验室特许公司;杜比国际公司
申请日： 2014-07-23 - 公布日： 2019-11-05 - 主分类号： G10L19/008
摘要：本发明的实施例涉及用于处理输入音频信号的方法，该方法包括：将所述输入音频信号分离为至少两个分量，其中第一分量的特征在于输入信号包络中的快速波动，而第二分量是随时间相对静止的；由去相关电路处理静止的所述第二分量，并且通过将所述去相关器电路的输出与输入信号和/或第一分量信号组合来构造输出信号。

多声道音频内容的编码和解码-201480050044.3
发明人： H·普恩哈根;H·默德;K·克约尔林 -专利权人：杜比国际公司
申请日： 2014-09-08 - 公布日： 2019-10-29 - 主分类号： G10L19/008
摘要：提供了用于对多声道音频内容进行编码和解码以供在具有N个声道的扬声器配置上回放的解码和编码方法。该解码方法包括：在第一解码模块中将M个输入音频信号解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号；并且对于所述N个声道中的超过M个声道的每一个，接收与所述M个中间信号中的一个对应的另外的输入音频信号，以及对输入音频信号及其对应的中间信号进行解码以便产生立体声信号，该立体声信号包括适合于在扬声器配置的N个声道中的两个上回放的第一音频信号和第二音频信号。

用于音频数据的压缩的方法、装置及计算机可读存储媒体-201480031271.1
发明人：迪潘让·森;刘尚忆 -专利权人：高通股份有限公司
申请日： 2014-05-29 - 公布日： 2019-10-22 - 主分类号： G10L19/008
摘要：大体来说，本发明描述用于确定用于声场的空间分量的压缩的量化步长的技术。一种包括一个或多个处理器的装置可经配置以执行所述技术。换句话说，所述一或多个处理器可经配置以确定待在压缩声场的空间分量时使用的量化步长，其中所述空间分量是通过相对于多个球谐系数执行基于向量的合成而产生。

针对音频声道及音频对象的音频编码及解码的概念-201480041459.4
发明人：亚历山大·阿达米;克里斯蒂安·鲍斯;萨沙·迪克;克里斯蒂安·厄特尔;西蒙·菲格;于尔根·赫勒;约翰内斯·希勒佩特;安德烈·赫尔策;迈克尔·卡拉舒曼;法比安·卡驰;阿西姆·孔茨;艾德里安·穆尔塔扎;简·普洛格施蒂斯;安德烈·希尔兹勒;汉内·斯滕泽尔 -专利权人：弗朗霍夫应用科学研究促进协会
申请日： 2014-07-16 - 公布日： 2019-10-22 - 主分类号： G10L19/008
摘要：一种音频编码器，用于编码音频输入数据(101)以取得音频输出数据(501)，其包含：输入接口(100)，用于接收多个音频声道、多个音频对象以及关于多个音频对象中的一个或多个音频对象的元数据；混合器(200)，用于混合多个对象以及多个声道以获得多个预混合声道，每一预混合声道包含声道的音频数据以及至少一个对象的音频数据；核心编码器(300)，用于核心编码核心编码器输入数据；以及元数据压缩器(400)，用于压缩关于多个音频对象中的一个或多个音频对象的元数据，其中音频编码器用于在一组两种模式的至少一个种模式下操作，该两种模式包含第一模式以及第二模式，在第一模式下该核心编码器用于编码多个音频声道和多个音频对象，多个音频声道和多个音频对象由输入接口所接收以作为核心编码器输入数据，在第二模式下核心编码器(300)用于接收由混合器(200)所产生的多个预混合声道，以作为核心编码器输入数据。

产生HOA信号的混合的空间/系数域表示的方法和设备-201480038940.8
发明人：斯文·科登;亚历山大·克鲁格 -专利权人：杜比国际公司
申请日： 2014-06-24 - 公布日： 2019-10-22 - 主分类号： G10L19/008
摘要：存在针对被称为HOA的高阶Ambisonics的两种表示：空间域和系数域。本发明从HOA信号的系数域表示产生混合的空间/系数域表示，其中，所述HOA信号的数目是可变的。系数域信号的矢量被分离为具有常数个HOA系数的系数域信号的矢量和具有可变数目的HOA系数的系数域信号的矢量。常数个HOA系数矢量被变换为相应的空间域信号矢量。为了便于高质量编码，在不产生信号不连续性的情况下，对系数域信号的可变数目的HOA系数矢量进行自适应归一化，并将其与空间域信号的矢量复用。

改进解码用实际三维声内容的子频带中的处理-201780079018.7
发明人：马修·巴奎;亚历山大·格汗 -专利权人：奥兰治公司
申请日： 2017-12-15 - 公布日： 2019-10-01 - 主分类号： G10L19/008
摘要：本发明涉及一种由计算机装置实施，用于处理包括定义一系列三维声频道的多阶的多个三维声分量的三维声内容的方法，其中每个三维声频道都表示三维声分量，方法包括：‑在多个频带中三维声分量的频率过滤，‑编译三维声解码矩阵(B)，‑处理三维声解码矩阵(B)，以通过矩阵尺寸缩减，提取每个与三维声阶和三维声阶用频带相关的多个三维声解码子矩阵(B1，B2)‑解码子矩阵于每个被选择频带中三维声分量的分别应用，以及所述相应应用结果的逐带重构，以传输多个解码的信号，每个解码的信号与声源相关。

用于编码和解码音频信号的方法和装置-201480032227.2
发明人：彼得·加克斯;亚历山大·库鲁格尔 -专利权人：杜比国际公司
申请日： 2014-05-27 - 公布日： 2019-10-01 - 主分类号： G10L19/008
摘要：本发明介绍了对HOA内容进行分层编码的新概念。用于编码分层音频比特流的方法包括：将HOA输入信号渲染为环绕立体声，编码环绕立体声以用于基础层输出信号，解码经编码的环绕立体声以获得经重建的环绕立体声信号，对所接收的HOA输入信号执行维度降低，计算经维度降低的HOA信号和经重建的环绕立体声信号之间的残差，编码该残差信号，以及将关于HOA输入信号的结构信息、经编码的残差和经编码的环绕立体声多路复用为比特流以获得分层音频比特流。

用于音频信号的参数重建的去相关器结构-201480056084.9
发明人： L·维尔莫斯;T·赫冯恩;H·普恩哈根 -专利权人：杜比国际公司
申请日： 2014-10-21 - 公布日： 2019-09-20 - 主分类号： G10L19/008
摘要：编码系统将数个音频信号(X)与湿上混系数和干上混系数(P，C)一起编码为下混信号(Y)。在解码系统中，预乘法器(101)通过根据第一组系数(Q)线性映射下混信号计算中间信号(W)；去相关部(102)基于中间信号输出去相关信号(Z)；湿上混部(103)通过根据湿上混系数线性映射去相关信号计算湿上混信号；干上混部(104)通过根据干上混系数线性映射下混信号计算干上混信号；组合部(105)通过组合湿上混信号和干上混信号提供多维重建信号(X)；并且转换器(106)基于湿上混系数和干上混系数计算第一组系数并且将其供给到预乘法器。

立体声音频信号编码器-201880009084.1
发明人： A·瓦西拉凯 -专利权人：诺基亚技术有限公司
申请日： 2018-01-03 - 公布日： 2019-09-13 - 主分类号： G10L19/008
摘要：一种方法，包括：接收至少两个音频通道信号；针对第一帧，确定表示至少两个通道音频信号之间的差异的至少两个参数；标量量化所述至少两个参数以生成至少两个索引值；对至少两个参数的初始标量量化参数进行自适应编码；确定初始标量量化参数是否具有与预定值不同的值；如果初始标量量化参数具有与预定值不同的值，则对任何未编码的标量量化参数进行自适应编码；如果初始标量量化参数具有等于预定值的值，则确定至少两个标量量化参数是否全部具有等于预定值的值；如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数中的至少一个具有与预定值不同的值，则对任何未编码的标量量化参数进行自适应编码，并生成指示输出是固定速率编码或可变速率编码中的一个的指示符；如果初始标量量化参数具有等于预定值的值且至少两个标量量化参数全部具有等于预定值的值，则生成指示输出是固定速率编码或可变速率编码中的另一个的指示符；根据至少两个参数，生成至少两个音频通道信号的单声道表示；以及对单声道表示进行编码。

高效率对象元数据编码的装置及方法-201480041458.X
发明人：克里斯蒂安·鲍斯;克里斯蒂安·埃特尔 -专利权人：弗朗霍夫应用科学研究促进协会
申请日： 2014-07-16 - 公布日： 2019-08-23 - 主分类号： G10L19/008
摘要：提供了一种用于产生至少一个音频声道的装置(100)。装置(100)包含用于接收至少一个压缩元数据信号的元数据解码器(110)。每一压缩元数据信号包含多个第一元数据样本。每一压缩元数据信号的第一元数据样本指示与至少一个音频对象信号中的音频对象信号相关联的信息。元数据解码器(110)用于产生至少一个重建元数据信号，使得每一重建元数据信号包含至少一个压缩元数据信号中的一个压缩元数据信号的第一元数据样本以及进一步包含多个第二元数据样本。而且，元数据解码器(110)根据重建元数据信号的至少两个第一元数据样本来产生每一重建元数据信号的每一第二元数据样本。而且，装置(100)包含音频声道发生器(120)，其根据至少一个音频对象信号以及至少一个重建元数据信号而产生至少一个音频声道。此外，提供了一种用于产生编码音频信息的装置，编码音频信息包含至少一个编码音频信号以及至少一个压缩元数据信号。

适配用于终端用户自由视点监控的分布式音频录制-201780081921.7
发明人： S·S·马特;L·拉克索南 -专利权人：诺基亚技术有限公司
申请日： 2017-12-27 - 公布日： 2019-08-16 - 主分类号： G10L19/008
摘要：通过分布式麦克风在多个音频信道中捕获音频场景。基于用户的视点和用户的至少一个偏好中的至少一个，从这些多个音频信道中选择(400、500)这些多个音频信道中的两个或更多个音频信道；基于用户的偏好、用户操作的设备(700)的软件应用的要求以及设备的操作条件的要求中的至少一个，对所选择的两个或更多个音频信道进行优先级排序(500、600)。在优先级排序(500、600)之后，将所选择的两个或更多个音频信道中的至少一个编码(600)成通过传输链路发送给设备(700)的编码监控混音(610‑1)。

音频编码系统、用于产生比特流的方法以及音频解码器-201480010021.X
发明人： T·弗瑞尔德里驰;A·米勒;K·林泽梅儿;C-C·司鹏格尔;T·R·万格布拉斯 -专利权人：杜比国际公司
申请日： 2014-02-21 - 公布日： 2019-08-13 - 主分类号： G10L19/008
摘要：本文档涉及音频编码系统。具体地说，本文档涉及用于参数化多声道音频编码的高效方法和系统。描述了音频编码系统(500)，其被配置为产生指示下混信号和空间元数据的比特流(564)，所述空间元数据用于从下混信号产生多声道上混信号。系统(500)包括下混处理单元(510)，其被配置为从多声道输入信号(561)产生下混信号；其中，下混信号包括m个声道，并且其中，多声道输入信号(561)包括n个声道；n、m是整数，其中，m＜n。此外，系统(500)包括参数处理单元(520)，其被配置为从多声道输入信号(561)确定空间元数据。另外，系统(500)包括配置单元(540)，其被配置为基于一个或多个外部设置确定对于参数处理单元(520)的一个或多个控制设置；其中，所述一个或多个外部设置包括比特流(564)的目标数据速率，并且其中，所述一个或多个控制设置包括空间元数据的最大数据速率。

时间偏移估计-201680072462.1
发明人： V·S·C·S·奇比亚姆;V·阿提 -专利权人：高通股份有限公司
申请日： 2016-12-09 - 公布日： 2019-08-13 - 主分类号： G10L19/008
摘要：本发明描述一种使信道非因果地移位的方法，其包含在编码器处估计比较值。每一比较值指示经先前捕获参考信道与对应经先前捕获目标信道之间的时间失配的量。所述方法还包含基于历史比较值数据及平滑参数来使所述比较值平滑以产生经平滑比较值。所述方法进一步包含基于所述经平滑比较值来估计暂定移位值。所述方法还包含使目标信道非因果地移位非因果移位值以产生与参考信道时间地对准的经调整目标信道。所述非因果移位值是基于所述暂定移位值。所述方法进一步包含基于参考信道及所述经调整目标信道来产生中频带信道或边频带信道中的至少一者。

使用边增益和残差增益对多声道信号进行编码或解码的装置和方法-201780079910.5
发明人：扬·比特;纪尧姆·福克斯;乌尔夫冈·雅吉斯;弗伦茨·罗伊特尔胡贝尔;于尔根·赫勒;埃伦尼·福托普楼;马库斯·马特拉斯;斯里坎斯·科塞 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2017-10-30 - 公布日： 2019-08-06 - 主分类号： G10L19/008
摘要：一种用于对包括至少两个声道101、102在内的多声道信号100进行编码的装置，包括：下混合器120，用于根据多声道信号100计算下混合信号122；参数计算器140，用于根据至少两个声道中的第一声道101和至少两个声道中的第二声道102计算边增益141，并且用于根据第一声道101和第二声道102计算残差增益142；以及输出接口160，用于产生输出信号，该输出信号包括与下混合信号122、边增益141和残差增益142有关的信息。

用于联合多声道编码的方法和设备-201480050053.2
发明人： K·克约尔林;H·默德;H·普恩哈根 -专利权人：杜比国际公司
申请日： 2014-09-08 - 公布日： 2019-07-16 - 主分类号： G10L19/008
摘要：公开了用于编码具有至少四个声道的音频系统的声道的编码和解码设备。解码设备具有使第一对输入声道经历第一立体声解码的第一立体声解码组件，以及使第二对输入声道经历第二立体声解码的第二立体声解码组件。第一和第二立体声解码组件的结果被交叉耦合到第三和第四立体声解码组件，第三和第四立体声解码组件中的每一个在从第一立体声解码组件得到的一个声道和从第二立体声解码组件得到的一个声道上执行立体声解码。

音频编码器和解码器-201480057784.X
发明人： H·普恩哈根;J·克里萨;L·维勒莫斯;T·赫冯恩 -专利权人：杜比国际公司
申请日： 2014-10-21 - 公布日： 2019-07-12 - 主分类号： G10L19/008
摘要：本公开落入音频编码领域，特别地，本公开涉及其中音频信息由多个信号表示的空间音频编码领域，其中，信号可以包括音频声道和/或音频对象。特别地，本公开提供了一种用于在音频解码系统中重构音频对象的方法和设备。此外，本公开提供了一种用于对这种音频对象进行编码的方法和装置。

用于多声道缩混/上混情况的通用空间音频对象编码参数化概念的解码器和方法-201380051915.9
发明人：托尔斯滕·卡斯特纳;于尔根·赫勒;莱昂·特伦提夫;奥利弗·赫尔穆特 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2013-08-05 - 公布日： 2019-06-28 - 主分类号： G10L19/008
摘要：提供了一种用于从包括一个或更多个缩混声道的缩混信号产生包括一个或更多个音频输出声道的音频输出信号的解码器。缩混信号编码两个或更多个音频对象信号。解码器包括阈值确定器(110)，用于根据两个或更多个音频对象信号中的至少一个的信号能量和/或噪声能量和/或者根据一个或更多个缩混声道中的至少一个的信号能量和/或噪声能量确定阈值。此外，解码器包括处理单元(120)，用于根据阈值从一个或更多个缩混声道产生一个或更多个音频输出声道。

声场的经分解表示的压缩-201480031162.X
发明人：尼尔斯·京特·彼得斯;迪潘让·森 -专利权人：高通股份有限公司
申请日： 2014-05-29 - 公布日： 2019-06-14 - 主分类号： G10L19/008
摘要：一般来说，本发明描述用于获得球谐系数的经分解版本的技术。根据这些技术，包括一或多个处理器的装置可经配置以确定表示声场的相异分量的向量的系数的第一非零集合，所述向量已从描述所述声场的多个球谐系数分解。

音频编码和解码方法、介质以及音频编码器和解码器-201480029603.2
发明人： H·普恩哈根;L·维尔莫斯;L·J·萨米尔森;T·赫冯恩 -专利权人：杜比国际公司
申请日： 2014-05-23 - 公布日： 2019-05-28 - 主分类号： G10L19/008
摘要：本公开提供了提供较不复杂且更加灵活的对在音频编码系统中引入的去相关的控制的方法、设备和计算机程序产品。根据本公开，这通过计算并使用用于在音频编码系统中引入音频对象的去相关的两个加权因子来实现，一个加权因子用于逼近音频对象，一个加权因子用于去相关音频对象。

用于对三维音频信号进行转换、立体声编码、解码和转码的过程-201780051834.7
发明人： B·贝纳德;F·贝克尔 -专利权人：冠状编码股份有限公司
申请日： 2017-09-28 - 公布日： 2019-05-21 - 主分类号： G10L19/008
摘要：本发明题为“用于对三维音频信号进行转换、立体声编码、解码和转码的过程”。本发明涉及对声学场、更具体地讲是一阶高保真度立体声响复制三维声学场进行转换、编码、解码和转码的方法，包括至少一种用于将所述声学场转换成球形场的方法、用于将所述球形场编码成立体声信号的方法、用于将立体声信号解码到球形场中的方法、或者用于将所述球形场转码成任何音频格式的方法。用于将高保真度立体声响复制声学场编码成球形场的方法在频域中执行将所述声学场分成三个分量，任选地分成两个分量，并且将所述分量分组到全球形场中。用于将所述球形场编码成立体声信号的方法在频域中执行全景和相位差值的确定、通道间域中相位差奇点的确定、通道间域中相位对应函数的确定、以及立体声形式的经编码信号的左分量和右分量的计算。球坐标任选地以仿射方式修改，以对应于左通道和右通道的标准几何布置。用于在球形场中解码的方法适用于任何立体声信号，尤其适用于通过所述编码方法获得的立体声信号。所述用于在球形场中解码的方法在频域中执行全景和相位差的确定；通道间域中相位差奇点的新位置的确定，所述位置随时间而变化；通道间域中相位对应函数的确定；对应于所期望球形场的复系数的确定；和所述球形场中原点方向的确定，所述方向任选地以仿射方式修改以对应于左通道和右通道的标准几何布置。所述用于从立体声信号进行转码的方法包括所述用于解码到球形场中的方法，然后包括提供球形场到给定音频全景定律上的投影的方法、或双耳化方法。

使用自适应捕捉从麦克风阵列生成空间音频信号格式-201780059645.4
发明人： J·维卡莫;M-V·莱蒂南 -专利权人：诺基亚技术有限公司
申请日： 2017-09-22 - 公布日： 2019-05-21 - 主分类号： G10L19/008
摘要：一种装置，包括处理器，所述处理器被配置为：接收至少两个麦克风音频信号；确定与所述至少两个麦克风音频信号相关联的空间元数据；以及基于至少一个麦克风音频信号和所述空间元数据来自适应地合成多个球面谐波音频信号，以便输出预定阶的空间音频信号格式。

用于解码编码音频信号以获取修改后的输出信号的装置和方法-201480041816.7
发明人：约尼·鲍卢斯;哈拉尔德·福斯;奥立夫·赫尔穆特;艾德里安·穆尔塔扎;法尔科·里德布施;里昂·特伦蒂夫 -专利权人：弗朗霍夫应用科学研究促进协会
申请日： 2014-07-18 - 公布日： 2019-05-03 - 主分类号： G10L19/008
摘要：一种用于解码编码音频信号(100)以获取修改后的输出信号(160)的装置，包括：输入接口(110)，用于接收传输的降混信号(112)和与传输的降混信号(112)中包括的音频对象相关的参数数据(114)，降混信号不同于参数数据与其相关的编码器降混信号；降混修改器(116)，用于利用降混修改函数修改传输的降混信号，其中进行所述降混修改，以使得修改后的降混信号与所述编码器降混信号相同，或者比传输的降混信号(112)更近似于编码器降混信号；对象渲染器(118)，用于利用修改后的降混信号和参数数据渲染音频对象，以获取输出信号；以及输出信号修改器(120)，用于利用输出信号修改函数修改输出信号,其中输出信号修改函数使得应用至编码降混信号以获取传输的降混信号(112)的处理操作被至少部分地应用至输出信号以获取修改后的输出信号(160)。

音频解码系统和音频编码系统-201480050422.8
发明人：拉尔斯·维尔默斯;利夫·约纳什·萨穆埃尔松;克里斯托弗·薛林;海科·普尔哈根;利夫·塞尔斯特伦 -专利权人：杜比国际公司
申请日： 2014-09-08 - 公布日： 2019-04-30 - 主分类号： G10L19/008
摘要：用于处理双通道输入信号(X)的音频解码系统(100)包括参数混合级(110)。参数混合级接收双通道输入信号和一组混合参数(P1)，并且输出双通道输出信号(Y1)。参数混合级包括基于输入信号输出去相关信号(D1)的去相关级(111)。参数混合级还包括混合矩阵(112)，其接收输入信号和去相关信号，并且形成来自输入信号和去相关信号的通道的双通道线性组合。混合矩阵输出该线性组合作为双通道输出信号。能够由该组混合参数来控制该线性组合的系数，并且该组中的至少四个混合参数能够被独立地指定。在示例实施方式中，多个参数混合级被用来独立地重构被编码在输入信号中的附加通道。

变换球谐系数-201480011287.6
发明人：迪潘让·森;马丁·詹姆斯·莫雷尔;尼尔斯·京特·彼得斯 -专利权人：高通股份有限公司
申请日： 2014-02-28 - 公布日： 2019-04-09 - 主分类号： G10L19/008
摘要：一般来说，本发明描述一种用于变换球谐系数的技术。一种包含一或多个处理器的装置可执行所述技术。所述处理器可经配置以：解析所述位流以确定变换信息，所述变换信息描述如何变换声场以减少提供与描述所述声场相关的信息的多个阶层元素的数目。所述处理器可进一步经配置以：当基于提供与描述所述声场相关的信息的所述多个阶层元素中的那些阶层元素来重现所述声场时，基于所述变换信息来变换所述声场以反转为减少所述多个阶层元素的所述数目所执行的所述变换。

通过3D音频定位来生成虚拟或增强现实呈现的方法和装置-201780046320.2
发明人： L·S·奥斯特洛维尔;B·T·科勒 -专利权人：华纳兄弟娱乐公司
申请日： 2017-05-25 - 公布日： 2019-04-02 - 主分类号： G10L19/008
摘要：描述了一种用于生成3D呈现的装置，其中3D呈现(其可以包括3D电影、VR(虚拟现实)和/或AR(增强现实)内容)来自包括原始音频部分和视觉部分的原始3D内容，形成多个场景，每个场景与具有相应音频特性的相应一个环境或多个环境相关联。至少一些场景中的原始音频部分被该装置修改以符合或补偿相应场景的声学特性和/或在其中进行呈现的位置的环境的声学特性。

增强一阶高保真度立体声响复制信号的方向性的方法和装置-201480015676.6
发明人： J.贝姆 -专利权人：杜比国际公司
申请日： 2014-03-17 - 公布日： 2019-03-22 - 主分类号： G10L19/008
摘要：来自提供被称为B格式信号的一阶高保真度立体声响复制信号的麦克风的记录提供对声音方向性的有限认知。声源被感知为比它们实际的更宽，特别是对于偏离中心的收听位置，并且声源往往被定位成来自最靠近的扬声器位置。在增强一阶高保真度立体声响复制信号的方向性的方法和装置中，从较低阶高保真度立体声响复制输入信号(10)提取(SFA)另外的方向性信息(22，23)。使用另外的方向性信息来估计更高阶高保真度立体声响复制系数(25a)，然后将其与输入信号的系数结合(CS)。从而增强高保真度立体声响复制信号的方向性，这在将高保真度立体声响复制信号解码成大声扬声器信号时得到空间源定位的增加的精确度。得到的输出信号具有比输入信号更多的能量。

音频编码器和解码器-201480011081.3
发明人： K·克约尔林;H·普恩哈根;H·默德;K·J·罗德恩;L·塞勒斯特罗姆 -专利权人：杜比国际公司
申请日： 2014-04-04 - 公布日： 2019-03-19 - 主分类号： G10L19/008
摘要：本公开提供了基于输入信号编码和解码多声道音频信号的方法、设备和计算机程序产品。根据本公开，使用了利用参数立体声编码和处理后的多声道音频信号的离散表示的混合方法，这对于某些比特速率可以提高编码和解码的音频的质量。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]具有多个子流的多声道音频信号的有效编码和解码有效

专利文献下载