[发明专利]生成组合的音频场景的描述的装置和方法有效

申请号：	201880077928.6	申请日：	2018-10-01
公开（公告）号：	CN111630592B	公开（公告）日：	2023-10-27
发明（设计）人：	纪尧姆·福克斯;于尔根·赫勒;法比安·库奇;斯蒂芬·朵拉;马库斯·马特拉斯;奥利弗·迪尔加特;奥立弗·乌博尔特;弗罗林·吉多;斯特凡·拜尔;沃尔夫冈·杰格斯	申请（专利权）人：	弗劳恩霍夫应用研究促进协会
主分类号：	G10L19/008	分类号：	G10L19/008;G10L19/16
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	罗松梅
地址：	德国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种用于生成组合的音频场景的描述的装置，包括：输入接口(100)，用于接收第一格式的第一场景的第一描述和第二格式的第二场景的第二描述，其中第二格式不同于第一格式；格式转换器(120)，用于将第一描述转换为通用格式，并且当第二格式不同于通用格式时将第二描述转换为通用格式；以及格式组合器(140)，用于组合通用格式的第一描述和通用格式的第二描述，以获得所述组合的音频场景。
搜索关键词：	生成组合音频场景描述装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会，未经弗劳恩霍夫应用研究促进协会许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201880077928.6/，转载请声明来源钻瓜专利网。

同类专利

用于具有多个反射的声源的改进的立体混响编码器-201680077847.7
发明人： P·贝尔泰 -专利权人： MIMI听力技术有限责任公司
申请日： 2016-12-08 - 公布日： 2023-10-27 - 主分类号： G10L19/008
摘要：本发明涉及用于具有多个反射的声波的立体混响编码器。要求保护的立体混响编码器改善了3D音频场景中的沉浸感。用于根据本发明的立体混响编码器的声源的反射的编码的复杂度小于根据现有技术的立体混响编码器的声源的反射的编码的复杂度。要求保护的立体混响编码器能够实时编码更多数量的声源反射。要求保护的立体混响编码器能够减少与立体混响编码有关的功耗，并且能够增加用于所述应用的移动设备的电池的寿命。

生成组合的音频场景的描述的装置和方法-201880077928.6
发明人：纪尧姆·福克斯;于尔根·赫勒;法比安·库奇;斯蒂芬·朵拉;马库斯·马特拉斯;奥利弗·迪尔加特;奥立弗·乌博尔特;弗罗林·吉多;斯特凡·拜尔;沃尔夫冈·杰格斯 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2018-10-01 - 公布日： 2023-10-27 - 主分类号： G10L19/008
摘要：一种用于生成组合的音频场景的描述的装置，包括：输入接口(100)，用于接收第一格式的第一场景的第一描述和第二格式的第二场景的第二描述，其中第二格式不同于第一格式；格式转换器(120)，用于将第一描述转换为通用格式，并且当第二格式不同于通用格式时将第二描述转换为通用格式；以及格式组合器(140)，用于组合通用格式的第一描述和通用格式的第二描述，以获得所述组合的音频场景。

用于语音去混响的多输入多输出（MIMO）音频信号处理-201780080189.1
发明人： S.M.卡萨里;F.内斯塔 -专利权人：辛纳普蒂克斯公司
申请日： 2017-12-22 - 公布日： 2023-10-27 - 主分类号： G10L19/008
摘要：用于适应性去混响的音频信号处理使用最小二乘方（LMS）滤波器，其具有优于常规LMS滤波器的改进的收敛，从而使得实施例对于减少针对在许多便携式和嵌入式设备（诸如智能电话、平板电脑、膝上型计算机和助听器）中使用的针对应用（一般诸如语音识别和音频通信）的混响的影响是实际的。LMS滤波器采用频率相关的适应性步长来加速预测性滤波器过程的收敛，从而与应用于相同输入的常规LMS滤波器相比需要更少的计算步骤。在低存储消耗成本下实现了改进的收敛。在声学声道的高非恒定条件下控制预测滤波器的更新改进了这种条件下的性能。该技术适合于单个或多个声道，并且可适用于麦克风阵列处理。

变换空间音频参数-202180095344.3
发明人： A·瓦西拉切 -专利权人：诺基亚技术有限公司
申请日： 2021-01-18 - 公布日： 2023-10-24 - 主分类号： G10L19/008
摘要：公开了一种用于空间音频编码的装置，该装置被配置为：对于两个或更多个音频信号，确定用于提供空间音频再现的第一空间音频方向参数和第二空间音频方向参数；量化第一空间音频方向参数(301)；将第二空间音频方向参数变换为具有相反的空间音频方向(303)；确定经变换的第二空间音频方向参数与经量化的第一空间音频方向参数之间的差异(305)；以及量化该差异(307)。

用于处理多通道音频信号的装置和方法-202280011393.9
发明人：李泰美;高祥铁;金敬来;金善民;金正奎;南佑铉;孙允宰;郑铉权;黄盛熙 -专利权人：三星电子株式会社
申请日： 2022-01-25 - 公布日： 2023-10-20 - 主分类号： G10L19/008
摘要：根据本公开的多种实施例，音频处理装置包括至少一个处理器，该处理器被配置为执行一个或多个指令以从至少一个第一音频信号获得下混的第二音频信号，获得与至少一个第一音频信号的误差消除相关的信息，从下混的第二音频信号解混至少一个第一音频信号，以及通过将与至少一个第一音频信号的误差消除相关的信息应用于从第二音频信号中解混的至少一个第一音频信号来重构至少一个第一音频信号。使用至少一个第一音频信号的原始信号功率或解码后的至少一个第一音频信号的第二信号功率中的至少一个来生成与误差消除相关的信息。

音频对象处理-202280016866.4
发明人： L·J·萨穆埃尔松;H·普尔纳根;L·维尔蒙斯 -专利权人：杜比国际公司
申请日： 2022-02-09 - 公布日： 2023-10-20 - 主分类号： G10L19/008
摘要：本发明涉及一种用于修改对象重建信息的方法，所述方法包括：获得一组N个空间音频对象，每一空间音频对象包含音频信号及空间元数据；获得表示所述N个空间音频对象的音频呈现；获得对象重建信息，所述对象重建信息经配置以从所述音频呈现重建所述N个空间音频对象；将所述重建信息应用于所述音频呈现以形成一组N个经重建空间音频对象；使用第一渲染配置，渲染所述N个空间音频对象以获得第一经渲染呈现，且渲染所述N个经重建空间音频对象以获得第二经渲染呈现；及基于所述第一经渲染呈现与所述第二经渲染呈现之间的差异而修改所述重建信息，借此形成经修改重建信息。

使用多点声场描述生成经增强的声场描述的装置及方法-201880060064.7
发明人：于尔根·赫勒;伊曼纽尔·哈毕兹 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2018-07-13 - 公布日： 2023-10-10 - 主分类号： G10L19/008
摘要：一种用于生成经增强的声场描述的装置，包括：声场生成器(100,250,260)，用于生成至少一个声场描述，至少一个声场描述指示关于至少一个参考位置的声场；以及元数据生成器(110)，用于生成与声场的空间信息相关的元数据，其中，至少一个声场描述和元数据构成经增强的声场描述。至少一个声场描述在某个情况下包括与至少一个参考位置相关的第一声场描述以及与不同于参考位置的另一参考位置相关的第二声场描述，以及与空间信息相关的元数据，该元数据指示参考位置和另一参考位置或两个参考位置之一以及在两个参考位置之间延伸的向量。

共享三维音频床-201780061519.2
发明人： R·N·海特坎普;P·A·埃德里;Z·伊布拉欣;P·J·拉德克;S·维尔森斯;B·C·麦克道尔 -专利权人：微软技术许可有限责任公司
申请日： 2017-10-03 - 公布日： 2023-10-03 - 主分类号： G10L19/008
摘要：提供了一种用于支持可用于多个软件应用的共享三维(“3D”)音频床的系统。该系统管理定义3D音频床的多个扬声器对象的床元数据。床元数据还将每个扬声器对象与位置相关联，该位置在一些配置中由三维坐标系定义。床元数据被传送到多个应用。然后，应用可以生成定制3D音频数据，该定制3D音频数据将个体音频流与3D音频床的个体扬声器对象相关联。然后，应用可以将定制3D音频数据传送到3D音频床引擎，这使得利用所选择的空间化技术处理定制3D音频数据并将3D音频数据绘制到输出设备。当空间化技术或输出设备改变时，可以改变3D床的各个方面。

利用自适应下混策略的沉浸式语音和音频服务(IVAS)-202180091875.5
发明人： H·穆特;D·S·麦格拉思;R·泰亚吉 -专利权人：杜比实验室特许公司;杜比国际公司
申请日： 2021-12-02 - 公布日： 2023-09-29 - 主分类号： G10L19/008
摘要：公开了一种音频信号编码/解码方法，该方法使用应用于编码器处的编码下混策略，该编码下混策略不同于应用于解码器处的解码重混/上混策略。基于下混编解码方案的类型，该方法包括：计算要被应用于输入音频信号的输入下混增益，以构造主下混通道；确定下混缩放增益，以缩放主下混通道；基于输入音频信号、输入下混增益和下混缩放增益生成预测增益；通过使用主下混通道和预测增益生成侧通道预测，并从侧通道中减去侧通道预测来确定来自侧通道的剩余通道；基于剩余通道中的能量确定解相关增益；编码主下混通道、剩余通道、预测增益和解相关增益；以及将比特流发送到解码器。

音频处理设备和方法-202280011465.X
发明人：南佑铉;高祥铁;金敬来;金正奎;孙允宰;李泰美;郑铉权;黄盛熙 -专利权人：三星电子株式会社
申请日： 2022-01-27 - 公布日： 2023-09-15 - 主分类号： G10L19/008
摘要：一种音频处理装置可以从与包括在第一声道组中的声道相对应的第一音频信号中获得与包括在第二声道组中的声道相对应的第二音频信号，通过使用人工智能(AI)模型对与基于与第二声道组的相关性从包括在第一声道组中的声道中识别的至少一个声道相对应的至少一个第三音频信号进行下采样，并且生成包括与包括在第二声道组中的声道相对应的第二音频信号和下采样的至少一个第三音频信号的比特流。第一声道组包括原始音频信号的声道组，并且第二声道组通过组合第一声道组中包括的声道中的至少两个声道来构建。

量化空间音频参数-202080108370.0
发明人： A·瓦西拉切 -专利权人：诺基亚技术有限公司
申请日： 2020-12-15 - 公布日： 2023-09-15 - 主分类号： G10L19/008
摘要：除其它外，还公开了一种用于空间音频编码的装置，该装置被配置为对空间音频方向参数进行量化和索引化，以形成量化的空间音频方向索引，其中空间音频方向参数与音频帧的频率子带的时间子帧相关联；以及通过计算在量化的空间音频方向索引与量化的平均空间音频方向索引之间的差，确定量化的空间音频差索引。

使用宽带对准参数与多个窄带对准参数编码或解码多声道信号的设备及方法-201780018903.4
发明人：斯特凡·拜尔;埃伦妮·福托波罗;马库斯·缪特拉斯;吉约姆·福克斯;伊曼纽尔·拉维利;马库斯·施奈尔;斯蒂芬·多拉;沃尔夫冈·耶格斯;马丁·迪茨;格兰·马尔科维奇 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2017-01-20 - 公布日： 2023-09-08 - 主分类号： G10L19/008
摘要：用于编码具有至少两个声道的多声道信号的设备，包含：参数确定器(100)，用于从多声道信号确定宽带对准参数及多个窄带对准参数；信号对准器(200)，用于使用宽带对准参数及多个窄带对准参数对准至少两个声道以获得已对准的声道；信号处理器(300)，用于使用已对准的声道计算中间信号及侧边信号；信号编码器(400)，用于编码中间信号以获得经编码的中间信号并用于编码侧边信号以获得经编码的侧边信号；及输出接口(500)，用于生成经编码的多声道信号，经编码的多声道信号包含经编码的中间信号、经编码的侧边信号、宽带对准参数的信息、及多个窄带对准参数的信息。

多流音频译码-201880040059.X
发明人： V·阿提;V·S·C·S·奇比亚姆;D·J·辛德尔 -专利权人：高通股份有限公司
申请日： 2018-06-26 - 公布日： 2023-09-08 - 主分类号： G10L19/008
摘要：本发明提供一种方法，其包含在音频编码器处接收音频数据的多个流。所述方法包含将优先级指派到所述多个流中的每一流及基于所述多个流中的每一流的所述优先级确定用于所述多个流的编码的置换序列。所述方法还包含根据所述置换序列编码所述多个流中的每一流的至少一部分。

使用相位补偿对多声道信号进行下混合或上混合的装置和方法-201780080571.2
发明人：扬·比特;纪尧姆·福克斯;沃尔夫冈·耶格斯;弗伦茨·罗伊特尔胡贝尔;于尔根·赫勒;埃伦尼·福托普楼;马库斯·马特拉斯;斯里坎斯·科塞 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2017-10-30 - 公布日： 2023-09-05 - 主分类号： G10L19/008
摘要：一种用于对包括至少两个声道(101、102)在内的多声道信号(100)进行下混合的装置，包括：下混合器(120)，用于根据所述多声道信号(100)来计算(34)下混合信号(122)，其中所述下混合器被配置为使用绝对相位补偿来计算(34)所述下混合，使得在计算所述下混合信号(122)时，所述至少两个声道中的仅具有较低能量的声道被旋转，或者所述至少两个声道中的具有较低能量的声道比具有较高能量的声道旋转得更强；以及输出接口(160)，用于产生输出信号，所述输出信号包括与所述下混合信号(122)有关的信息。

用于定向相关编码方案的声音分量旋转-202180080992.1
发明人： S·布鲁恩;H·蒙特;D·S·麦格拉思;S·布朗 -专利权人：杜比实验室特许公司;杜比国际公司
申请日： 2021-12-02 - 公布日： 2023-08-29 - 主分类号： G10L19/008
摘要：本发明提供一种用于编码基于场景的音频的方法。在一些实施方案中，所述方法涉及由编码器确定输入音频信号的帧中的主要声音分量的空间方向。在一些实施方案中，所述方法涉及基于所述所确定空间方向及要用于编码所述输入音频信号的编码方案的方向偏好来确定旋转参数。在一些实施方案中，所述方法涉及基于所述旋转参数旋转所述帧的声音分量，使得在旋转之后，所述主要声音分量具有与所述编码方案的所述方向偏好对准的空间方向。在一些实施方案中，所述方法涉及结合所述旋转参数的指示或所述主要声音分量的所述空间方向的指示，使用所述编码方案编码所述输入音频信号的所述帧的所述经旋转声音分量。

用于对多声道音频信号进行编码的旋转矩阵的优化编码-202180086083.9
发明人： S·拉戈 -专利权人：奥兰治
申请日： 2021-12-09 - 公布日： 2023-08-29 - 主分类号： G10L19/008
摘要：本发明涉及一种用于对多声道声音信号进行编码的方法，该方法包括形成要应用于输入信号的呈旋转矩阵形式的变换矩阵、量化该旋转矩阵、在应用该旋转矩阵之后对经变换的信号进行编码，并且其中，量化该旋转矩阵包括以下操作：‑在四元数域中用至少一个第一四元数来转换(E300)该旋转矩阵；‑强制(E320)使所述第一四元数具有正分量；‑将该至少一个第一四元数转换为球面坐标，这些球面坐标之一与该第一四元数的正强制分量相关联；量化(E330)这些所产生的旋转球面坐标，与该第一四元数的正强制分量相关联的球面坐标在半长度区间内被量化。本发明还涉及一种对应的解码方法、一种编码设备以及一种解码设备。

用于多声道编码中的立体声填充的装置和方法-201780023524.4
发明人：萨沙·迪克;克里斯汀·赫姆瑞希;尼古拉斯·里特尔博谢;弗洛里安·舒;理查德·福格;弗雷德里克·纳格尔 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2017-02-14 - 公布日： 2023-08-18 - 主分类号： G10L19/008
摘要：提出一种用于对当前帧的编码的多声道信号进行解码以获得三个或更多个当前音频输出声道的装置。多声道处理器适于根据第一多声道参数从三个或更多个解码的声道中选择两个解码的声道。此外，多声道处理器适于基于所选声道生成第一组两个或更多个处理的声道。噪声填充模块适于针对所选声道中的至少一个声道来标识其内部所有谱线被量化为零的一个或多个频带，并且适于根据辅助信息使用已解码的三个或更多个先前音频输出声道的适当子集来生成混合声道，并且适于以使用所述混合声道的谱线生成的噪声来填充其内部所有谱线被量化为零的频带的谱线。

用于高阶立体环绕声的音频数据的分层中间压缩-201880030436.1
发明人：金墨永;N·G·彼得斯;D·森 -专利权人：高通股份有限公司
申请日： 2018-04-04 - 公布日： 2023-08-18 - 主分类号： G10L19/008
摘要：一般来说，描述用于执行高阶立体环绕声HOA的音频数据的分层中间压缩的技术。包括存储器及处理器的装置可经配置以执行所述技术。所述存储器可存储所述HOA音频数据的HOA系数。所述处理器可将所述HOA系数分解成主要声音分量及对应空间分量。所述空间分量可表示所述主要声音分量的方向、形状及宽度，且定义于球谐域中。所述处理器可在符合中间压缩格式的位流中指定所述HOA系数的表示环境分量的子集。所述处理器还可在所述位流中且无关于对用以在所述位流中指定所述空间分量的环境声道的最小数目及元素的数目的确定指定所述空间分量的所有元素。

用于六自由度应用的多个分布式流的矢量场插值-202180083035.4
发明人： S·M·A·萨尔辛;N·G·彼得斯;S·G·斯瓦米纳坦;I·G·穆诺茨 -专利权人：高通股份有限公司
申请日： 2021-12-16 - 公布日： 2023-08-08 - 主分类号： G10L19/008
摘要：示例设备包括被配置为存储与多个音频流相关联的音频数据和位置数据的存储器以及耦合到该存储器的一个或多个处理器。一个或多个处理器被配置为获得包括音频源的第一音频流的第一位置并且获得包括音频源的第二音频流的第二位置。一个或多个处理器被配置为分别基于音频源的位置和第一位置以及音频源的位置和第二位置来生成源自第一位置和第二位置的方向矢量。一个或多个处理器还被配置为基于第一方向矢量和第二方向矢量来确定描述矢量场的参数。

多通道编解码器中的空间噪声填充-202180081475.6
发明人： R·特亚吉;M·伊科特 -专利权人：杜比实验室特许公司
申请日： 2021-12-01 - 公布日： 2023-08-04 - 主分类号： G10L19/008
摘要：公开了用于多通道编解码器中的空间噪声填充的实施例。在一个实施例中，一种通过生成空间空洞填充噪声在多通道编解码器中重新生成背景噪声环境的方法，包括：基于从表示具有背景噪声环境的空间音频场景的输入音频信号生成的主下混通道计算噪声估计；基于该噪声估计计算频谱整形滤波器系数；使用频谱整形滤波器系数和噪声分布对多通道噪声信号进行频谱整形，频谱整形得到具有不相关通道的扩散的多通道噪声信号；基于空间音频场景的噪声环境，对具有不相关通道的扩散的、不相关的多通道噪声信号进行空间整形；并且将空间和频谱整形的多通道噪声添加到多通道编解码器输出，以合成空间音频场景的背景噪声环境。

对多个音频对象进行编码的装置和方法以及使用两个或更多个相关音频对象进行解码的装置和方法-202180076553.3
发明人：安德里亚·艾肯塞尔;斯里坎特·科斯;斯特凡·拜尔;法比恩·屈希;奥利弗·迪尔加特;纪尧姆·福克斯;多米尼克·韦克贝克;于尔根·赫勒;马库斯·马特拉斯 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2021-10-12 - 公布日： 2023-08-01 - 主分类号： G10L19/008
摘要：一种用于对多个音频对象进行编码的装置，包括：对象参数计算器(100)，被配置为：针对与时间帧相关的多个频率区间中的一个或多个频率区间，计算至少两个相关音频对象的参数数据，其中，至少两个相关音频对象的数量低于多个音频对象的总数；以及输出接口(200)，被配置为输出编码音频信号，该编码音频信号包括关于一个或多个频率区间的至少两个相关音频对象的参数数据的信息。

用于音频编解码器中的音频带宽检测和音频带宽切换的方法和设备-202180070612.6
发明人： V·埃克斯勒 -专利权人：沃伊斯亚吉公司
申请日： 2021-10-14 - 公布日： 2023-08-01 - 主分类号： G10L19/008
摘要：一种在声音编解码器的编码器部分中检测待编码的声音信号的音频带宽的方法和设备。该设备包括声音信号分析器和最终音频带宽决定模块，该最终音频带宽决定模块用于使用声音信号的分析的结果产生关于检测的音频带宽的最终决定。在编码器部分中，最终音频带宽决定模块位于声音信号分析器的上游。此外，一种方法和设备从声音信号的第一音频带宽切换到第二音频带宽。在编码器部分中，该设备包括：用于产生待编码的声音信号的关于检测的音频带宽的最终决定的最终音频带宽决定模块、响应于检测的音频带宽的最终决定而发生音频带宽切换的帧的计数值以及响应于帧的计数值的用于在对声音信号进行编码之前对其进行衰减的衰减器。

使用参数转换来处理编码音频场景的装置、方法或计算机程序-202180069362.4
发明人：弗伦茨·罗伊特尔胡贝尔;吉洛姆·福赫斯;马库斯·马特拉斯;埃伦尼·福托普楼;斯特凡·拜尔;扬·比特;斯蒂芬·朵拉 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2021-10-08 - 公布日： 2023-08-01 - 主分类号： G10L19/008
摘要：一种用于处理表示与虚拟听者位置相关的声场的编码音频场景(130)的装置，该编码音频场景包括关于传输信号(122)的信息和与虚拟听者位置相关的第一参数集(112)，所述装置包括：参数转换器(110)，用于将第一参数集(112)转换为第二参数集(114)，该第二参数集(114)与包括两个或更多个声道的声道表示相关，用于在预定义空间位置处再现两个或更多个声道；以及输出接口(120)，用于使用第二参数集和关于传输信号(122)的信息来生成经处理的音频场景(124)。

量化空间音频参数-202180076948.3
发明人： T·皮拉亚库亚;A·瓦西拉切;M-V·莱蒂南 -专利权人：诺基亚技术有限公司
申请日： 2021-08-19 - 公布日： 2023-07-28 - 主分类号： G10L19/008
摘要：尤其公开了一种用于空间音频编码的装置，该装置被配置为将与一个或多个音频信号的时频块关联的两个或更多个能量比转换为与两个或更多个能量比相关的另外的能量比参数；使用第一量化器量化该另外的能量比参数；依赖于两个或更多个能量比中的第一能量比与两个或更多个能量比之和的比率来确定能量比的分布因子；使用经量化的该另外的能量比参数从多个另外的量化器中选择另外的量化器；并且使用所选择的该另外的量化器来量化能量比的分布因子。

音频信号之间的声道间相位差的编码和解码-201780036764.8
发明人： V·S·C·S·奇比亚姆;V·S·阿提 -专利权人：高通股份有限公司
申请日： 2017-06-13 - 公布日： 2023-07-28 - 主分类号： G10L19/008
摘要：一种用于处理音频信号的装置包含声道间时间失配分析器、声道间相位差IPD模式选择器和IPD估计器。所述声道间时间失配分析器被配置成确定指示第一音频信号与第二音频信号之间的时间未对准的声道间时间失配值。所述IPD模式选择器被配置成至少基于所述声道间时间失配值选择IPD模式。所述IPD估计器被配置成基于所述第一音频信号和所述第二音频信号确定IPD值。所述IPD值具有对应于所述选定IPD模式的分辨率。

多通道空间音频格式输入信号的处理-201880041822.0
发明人： D·S·麦格拉思 -专利权人：杜比实验室特许公司
申请日： 2018-05-02 - 公布日： 2023-07-28 - 主分类号： G10L19/008
摘要：本发明提供用于处理多通道空间音频格式输入信号的设备、计算机可读媒体和方法。举例来说，一种此类方法包括基于所接收的空间音频格式输入信号确定对象方位元数据；和基于所述所接收的空间音频格式输入信号提取对象音频信号，其中所述基于所述所接收的空间音频格式输入信号提取对象音频信号包含确定对象音频信号和残余音频信号。

将多声道音频内容转换成基于对象的音频内容的方法及用于处理具有空间位置的音频内容的方法-201780033796.2
发明人： G·真加勒;A·马特奥斯·索莱 -专利权人：杜比国际公司
申请日： 2017-05-29 - 公布日： 2023-07-25 - 主分类号： G10L19/008
摘要：本发明属于基于对象的音频内容的领域，且更明确来说，本发明涉及将多声道音频内容转换成基于对象的音频内容的领域。本发明进一步涉及用于处理具有空间位置的音频内容的时间帧的方法。

用于组合重复噪声信号的装置和方法-202180063587.9
发明人：克里斯汀·鲍斯 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2021-09-14 - 公布日： 2023-07-18 - 主分类号： G10L19/008
摘要：描述了用于组合三个或更多个音频信号的装置。该装置包括：分割块，用于将每个音频信号分割为段；权重确定块，被配置为确定时间加权音频信号段中的每一个的权重值；组合块，用于组合每个音频信号的时间加权音频信号段；以及合成块，用于生成输出音频信号。还描述了用于组合三个或更多个音频信号的方法和计算机程序产品。

使用带宽扩展来处理编码音频场景的装置、方法或计算机程序-202180069361.X
发明人：弗伦茨·罗伊特尔胡贝尔;吉洛姆·福赫斯;马库斯·马特拉斯;埃伦尼·福托普楼;斯特凡·拜尔;扬·比特;斯蒂芬·朵拉 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2021-10-08 - 公布日： 2023-07-18 - 主分类号： G10L19/008
摘要：一种用于处理表示声场的音频场景(130)的装置，该音频场景包括关于传输信号(122)的信息和参数集(112；114)。该装置包括：输出接口(120)，用于使用参数集(112；114)和关于传输信号(122)的信息来生成经处理的音频场景(124)，其中，输出接口(120)被配置为使用参数集(112；114)和传输信号(112；144)来生成两个或更多个声道的原始表示；多声道增强器(990)，用于使用传输信号(122)来生成两个或更多个声道的增强表示；以及信号组合器(940)，用于将两个或更多个声道的原始表示和两个或更多个声道的增强表示进行组合以获得经处理的音频场景(124)。

使用参数平滑来处理编码音频场景的装置、方法或计算机程序-202180069403.X
发明人：弗伦茨·罗伊特尔胡贝尔;吉洛姆·福赫斯;马库斯·马特拉斯;埃伦尼·福托普楼;斯特凡·拜尔;扬·比特;斯蒂芬·朵拉 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2021-10-08 - 公布日： 2023-07-14 - 主分类号： G10L19/008
摘要：一种用于处理表示声场的音频场景(130)的装置，音频场景(130)包括关于传输信号(122)的信息和第一参数集(112)。该装置包括参数处理器(110)，用于处理第一参数集(112)以获得第二参数集(114)，其中，参数处理器(110)被配置为使用针对输入时间帧(210)的第一参数集(112)中的至少一个参数来计算每个输出时间帧(220)的至少一个原始参数(252)、根据平滑规则来计算平滑信息(512；522)(例如，针对每个原始参数(252)的因子)、以及将对应平滑信息(512；522)应用于对应原始参数(252)以导出针对输出时间帧(220)的第二参数集(114)的参数。该装置还包括输出接口(120)，用于使用第二参数集(114)和关于传输信号(122)的信息来生成经处理的音频场景(124)。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]生成组合的音频场景的描述的装置和方法有效

专利文献下载