[发明专利]生成组合的音频场景的描述的装置和方法有效

专利信息
申请号: 201880077928.6 申请日: 2018-10-01
公开(公告)号: CN111630592B 公开(公告)日: 2023-10-27
发明(设计)人: 纪尧姆·福克斯;于尔根·赫勒;法比安·库奇;斯蒂芬·朵拉;马库斯·马特拉斯;奥利弗·迪尔加特;奥立弗·乌博尔特;弗罗林·吉多;斯特凡·拜尔;沃尔夫冈·杰格斯 申请(专利权)人: 弗劳恩霍夫应用研究促进协会
主分类号: G10L19/008 分类号: G10L19/008;G10L19/16
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 罗松梅
地址: 德国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种用于生成组合的音频场景的描述的装置,包括:输入接口(100),用于接收第一格式的第一场景的第一描述和第二格式的第二场景的第二描述,其中第二格式不同于第一格式;格式转换器(120),用于将第一描述转换为通用格式,并且当第二格式不同于通用格式时将第二描述转换为通用格式;以及格式组合器(140),用于组合通用格式的第一描述和通用格式的第二描述,以获得所述组合的音频场景。
搜索关键词: 生成 组合 音频 场景 描述 装置 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201880077928.6/,转载请声明来源钻瓜专利网。

同类专利
  • 用于具有多个反射的声源的改进的立体混响编码器-201680077847.7
  • P·贝尔泰 - MIMI听力技术有限责任公司
  • 2016-12-08 - 2023-10-27 - G10L19/008
  • 本发明涉及用于具有多个反射的声波的立体混响编码器。要求保护的立体混响编码器改善了3D音频场景中的沉浸感。用于根据本发明的立体混响编码器的声源的反射的编码的复杂度小于根据现有技术的立体混响编码器的声源的反射的编码的复杂度。要求保护的立体混响编码器能够实时编码更多数量的声源反射。要求保护的立体混响编码器能够减少与立体混响编码有关的功耗,并且能够增加用于所述应用的移动设备的电池的寿命。
  • 用于语音去混响的多输入多输出(MIMO)音频信号处理-201780080189.1
  • S.M.卡萨里;F.内斯塔 - 辛纳普蒂克斯公司
  • 2017-12-22 - 2023-10-27 - G10L19/008
  • 用于适应性去混响的音频信号处理使用最小二乘方(LMS)滤波器,其具有优于常规LMS滤波器的改进的收敛,从而使得实施例对于减少针对在许多便携式和嵌入式设备(诸如智能电话、平板电脑、膝上型计算机和助听器)中使用的针对应用(一般诸如语音识别和音频通信)的混响的影响是实际的。LMS滤波器采用频率相关的适应性步长来加速预测性滤波器过程的收敛,从而与应用于相同输入的常规LMS滤波器相比需要更少的计算步骤。在低存储消耗成本下实现了改进的收敛。在声学声道的高非恒定条件下控制预测滤波器的更新改进了这种条件下的性能。该技术适合于单个或多个声道,并且可适用于麦克风阵列处理。
  • 变换空间音频参数-202180095344.3
  • A·瓦西拉切 - 诺基亚技术有限公司
  • 2021-01-18 - 2023-10-24 - G10L19/008
  • 公开了一种用于空间音频编码的装置,该装置被配置为:对于两个或更多个音频信号,确定用于提供空间音频再现的第一空间音频方向参数和第二空间音频方向参数;量化第一空间音频方向参数(301);将第二空间音频方向参数变换为具有相反的空间音频方向(303);确定经变换的第二空间音频方向参数与经量化的第一空间音频方向参数之间的差异(305);以及量化该差异(307)。
  • 用于处理多通道音频信号的装置和方法-202280011393.9
  • 李泰美;高祥铁;金敬来;金善民;金正奎;南佑铉;孙允宰;郑铉权;黄盛熙 - 三星电子株式会社
  • 2022-01-25 - 2023-10-20 - G10L19/008
  • 根据本公开的多种实施例,音频处理装置包括至少一个处理器,该处理器被配置为执行一个或多个指令以从至少一个第一音频信号获得下混的第二音频信号,获得与至少一个第一音频信号的误差消除相关的信息,从下混的第二音频信号解混至少一个第一音频信号,以及通过将与至少一个第一音频信号的误差消除相关的信息应用于从第二音频信号中解混的至少一个第一音频信号来重构至少一个第一音频信号。使用至少一个第一音频信号的原始信号功率或解码后的至少一个第一音频信号的第二信号功率中的至少一个来生成与误差消除相关的信息。
  • 音频对象处理-202280016866.4
  • L·J·萨穆埃尔松;H·普尔纳根;L·维尔蒙斯 - 杜比国际公司
  • 2022-02-09 - 2023-10-20 - G10L19/008
  • 本发明涉及一种用于修改对象重建信息的方法,所述方法包括:获得一组N个空间音频对象,每一空间音频对象包含音频信号及空间元数据;获得表示所述N个空间音频对象的音频呈现;获得对象重建信息,所述对象重建信息经配置以从所述音频呈现重建所述N个空间音频对象;将所述重建信息应用于所述音频呈现以形成一组N个经重建空间音频对象;使用第一渲染配置,渲染所述N个空间音频对象以获得第一经渲染呈现,且渲染所述N个经重建空间音频对象以获得第二经渲染呈现;及基于所述第一经渲染呈现与所述第二经渲染呈现之间的差异而修改所述重建信息,借此形成经修改重建信息。
  • 使用多点声场描述生成经增强的声场描述的装置及方法-201880060064.7
  • 于尔根·赫勒;伊曼纽尔·哈毕兹 - 弗劳恩霍夫应用研究促进协会
  • 2018-07-13 - 2023-10-10 - G10L19/008
  • 一种用于生成经增强的声场描述的装置,包括:声场生成器(100,250,260),用于生成至少一个声场描述,至少一个声场描述指示关于至少一个参考位置的声场;以及元数据生成器(110),用于生成与声场的空间信息相关的元数据,其中,至少一个声场描述和元数据构成经增强的声场描述。至少一个声场描述在某个情况下包括与至少一个参考位置相关的第一声场描述以及与不同于参考位置的另一参考位置相关的第二声场描述,以及与空间信息相关的元数据,该元数据指示参考位置和另一参考位置或两个参考位置之一以及在两个参考位置之间延伸的向量。
  • 共享三维音频床-201780061519.2
  • R·N·海特坎普;P·A·埃德里;Z·伊布拉欣;P·J·拉德克;S·维尔森斯;B·C·麦克道尔 - 微软技术许可有限责任公司
  • 2017-10-03 - 2023-10-03 - G10L19/008
  • 提供了一种用于支持可用于多个软件应用的共享三维(“3D”)音频床的系统。该系统管理定义3D音频床的多个扬声器对象的床元数据。床元数据还将每个扬声器对象与位置相关联,该位置在一些配置中由三维坐标系定义。床元数据被传送到多个应用。然后,应用可以生成定制3D音频数据,该定制3D音频数据将个体音频流与3D音频床的个体扬声器对象相关联。然后,应用可以将定制3D音频数据传送到3D音频床引擎,这使得利用所选择的空间化技术处理定制3D音频数据并将3D音频数据绘制到输出设备。当空间化技术或输出设备改变时,可以改变3D床的各个方面。
  • 利用自适应下混策略的沉浸式语音和音频服务(IVAS)-202180091875.5
  • H·穆特;D·S·麦格拉思;R·泰亚吉 - 杜比实验室特许公司;杜比国际公司
  • 2021-12-02 - 2023-09-29 - G10L19/008
  • 公开了一种音频信号编码/解码方法,该方法使用应用于编码器处的编码下混策略,该编码下混策略不同于应用于解码器处的解码重混/上混策略。基于下混编解码方案的类型,该方法包括:计算要被应用于输入音频信号的输入下混增益,以构造主下混通道;确定下混缩放增益,以缩放主下混通道;基于输入音频信号、输入下混增益和下混缩放增益生成预测增益;通过使用主下混通道和预测增益生成侧通道预测,并从侧通道中减去侧通道预测来确定来自侧通道的剩余通道;基于剩余通道中的能量确定解相关增益;编码主下混通道、剩余通道、预测增益和解相关增益;以及将比特流发送到解码器。
  • 音频处理设备和方法-202280011465.X
  • 南佑铉;高祥铁;金敬来;金正奎;孙允宰;李泰美;郑铉权;黄盛熙 - 三星电子株式会社
  • 2022-01-27 - 2023-09-15 - G10L19/008
  • 一种音频处理装置可以从与包括在第一声道组中的声道相对应的第一音频信号中获得与包括在第二声道组中的声道相对应的第二音频信号,通过使用人工智能(AI)模型对与基于与第二声道组的相关性从包括在第一声道组中的声道中识别的至少一个声道相对应的至少一个第三音频信号进行下采样,并且生成包括与包括在第二声道组中的声道相对应的第二音频信号和下采样的至少一个第三音频信号的比特流。第一声道组包括原始音频信号的声道组,并且第二声道组通过组合第一声道组中包括的声道中的至少两个声道来构建。
  • 量化空间音频参数-202080108370.0
  • A·瓦西拉切 - 诺基亚技术有限公司
  • 2020-12-15 - 2023-09-15 - G10L19/008
  • 除其它外,还公开了一种用于空间音频编码的装置,该装置被配置为对空间音频方向参数进行量化和索引化,以形成量化的空间音频方向索引,其中空间音频方向参数与音频帧的频率子带的时间子帧相关联;以及通过计算在量化的空间音频方向索引与量化的平均空间音频方向索引之间的差,确定量化的空间音频差索引。
  • 用于定向相关编码方案的声音分量旋转-202180080992.1
  • S·布鲁恩;H·蒙特;D·S·麦格拉思;S·布朗 - 杜比实验室特许公司;杜比国际公司
  • 2021-12-02 - 2023-08-29 - G10L19/008
  • 本发明提供一种用于编码基于场景的音频的方法。在一些实施方案中,所述方法涉及由编码器确定输入音频信号的帧中的主要声音分量的空间方向。在一些实施方案中,所述方法涉及基于所述所确定空间方向及要用于编码所述输入音频信号的编码方案的方向偏好来确定旋转参数。在一些实施方案中,所述方法涉及基于所述旋转参数旋转所述帧的声音分量,使得在旋转之后,所述主要声音分量具有与所述编码方案的所述方向偏好对准的空间方向。在一些实施方案中,所述方法涉及结合所述旋转参数的指示或所述主要声音分量的所述空间方向的指示,使用所述编码方案编码所述输入音频信号的所述帧的所述经旋转声音分量。
  • 用于对多声道音频信号进行编码的旋转矩阵的优化编码-202180086083.9
  • S·拉戈 - 奥兰治
  • 2021-12-09 - 2023-08-29 - G10L19/008
  • 本发明涉及一种用于对多声道声音信号进行编码的方法,该方法包括形成要应用于输入信号的呈旋转矩阵形式的变换矩阵、量化该旋转矩阵、在应用该旋转矩阵之后对经变换的信号进行编码,并且其中,量化该旋转矩阵包括以下操作:‑在四元数域中用至少一个第一四元数来转换(E300)该旋转矩阵;‑强制(E320)使所述第一四元数具有正分量;‑将该至少一个第一四元数转换为球面坐标,这些球面坐标之一与该第一四元数的正强制分量相关联;量化(E330)这些所产生的旋转球面坐标,与该第一四元数的正强制分量相关联的球面坐标在半长度区间内被量化。本发明还涉及一种对应的解码方法、一种编码设备以及一种解码设备。
  • 用于高阶立体环绕声的音频数据的分层中间压缩-201880030436.1
  • 金墨永;N·G·彼得斯;D·森 - 高通股份有限公司
  • 2018-04-04 - 2023-08-18 - G10L19/008
  • 一般来说,描述用于执行高阶立体环绕声HOA的音频数据的分层中间压缩的技术。包括存储器及处理器的装置可经配置以执行所述技术。所述存储器可存储所述HOA音频数据的HOA系数。所述处理器可将所述HOA系数分解成主要声音分量及对应空间分量。所述空间分量可表示所述主要声音分量的方向、形状及宽度,且定义于球谐域中。所述处理器可在符合中间压缩格式的位流中指定所述HOA系数的表示环境分量的子集。所述处理器还可在所述位流中且无关于对用以在所述位流中指定所述空间分量的环境声道的最小数目及元素的数目的确定指定所述空间分量的所有元素。
  • 多通道编解码器中的空间噪声填充-202180081475.6
  • R·特亚吉;M·伊科特 - 杜比实验室特许公司
  • 2021-12-01 - 2023-08-04 - G10L19/008
  • 公开了用于多通道编解码器中的空间噪声填充的实施例。在一个实施例中,一种通过生成空间空洞填充噪声在多通道编解码器中重新生成背景噪声环境的方法,包括:基于从表示具有背景噪声环境的空间音频场景的输入音频信号生成的主下混通道计算噪声估计;基于该噪声估计计算频谱整形滤波器系数;使用频谱整形滤波器系数和噪声分布对多通道噪声信号进行频谱整形,频谱整形得到具有不相关通道的扩散的多通道噪声信号;基于空间音频场景的噪声环境,对具有不相关通道的扩散的、不相关的多通道噪声信号进行空间整形;并且将空间和频谱整形的多通道噪声添加到多通道编解码器输出,以合成空间音频场景的背景噪声环境。
  • 用于音频编解码器中的音频带宽检测和音频带宽切换的方法和设备-202180070612.6
  • V·埃克斯勒 - 沃伊斯亚吉公司
  • 2021-10-14 - 2023-08-01 - G10L19/008
  • 一种在声音编解码器的编码器部分中检测待编码的声音信号的音频带宽的方法和设备。该设备包括声音信号分析器和最终音频带宽决定模块,该最终音频带宽决定模块用于使用声音信号的分析的结果产生关于检测的音频带宽的最终决定。在编码器部分中,最终音频带宽决定模块位于声音信号分析器的上游。此外,一种方法和设备从声音信号的第一音频带宽切换到第二音频带宽。在编码器部分中,该设备包括:用于产生待编码的声音信号的关于检测的音频带宽的最终决定的最终音频带宽决定模块、响应于检测的音频带宽的最终决定而发生音频带宽切换的帧的计数值以及响应于帧的计数值的用于在对声音信号进行编码之前对其进行衰减的衰减器。
  • 量化空间音频参数-202180076948.3
  • T·皮拉亚库亚;A·瓦西拉切;M-V·莱蒂南 - 诺基亚技术有限公司
  • 2021-08-19 - 2023-07-28 - G10L19/008
  • 尤其公开了一种用于空间音频编码的装置,该装置被配置为将与一个或多个音频信号的时频块关联的两个或更多个能量比转换为与两个或更多个能量比相关的另外的能量比参数;使用第一量化器量化该另外的能量比参数;依赖于两个或更多个能量比中的第一能量比与两个或更多个能量比之和的比率来确定能量比的分布因子;使用经量化的该另外的能量比参数从多个另外的量化器中选择另外的量化器;并且使用所选择的该另外的量化器来量化能量比的分布因子。
  • 音频信号之间的声道间相位差的编码和解码-201780036764.8
  • V·S·C·S·奇比亚姆;V·S·阿提 - 高通股份有限公司
  • 2017-06-13 - 2023-07-28 - G10L19/008
  • 一种用于处理音频信号的装置包含声道间时间失配分析器、声道间相位差IPD模式选择器和IPD估计器。所述声道间时间失配分析器被配置成确定指示第一音频信号与第二音频信号之间的时间未对准的声道间时间失配值。所述IPD模式选择器被配置成至少基于所述声道间时间失配值选择IPD模式。所述IPD估计器被配置成基于所述第一音频信号和所述第二音频信号确定IPD值。所述IPD值具有对应于所述选定IPD模式的分辨率。
  • 多通道空间音频格式输入信号的处理-201880041822.0
  • D·S·麦格拉思 - 杜比实验室特许公司
  • 2018-05-02 - 2023-07-28 - G10L19/008
  • 本发明提供用于处理多通道空间音频格式输入信号的设备、计算机可读媒体和方法。举例来说,一种此类方法包括基于所接收的空间音频格式输入信号确定对象方位元数据;和基于所述所接收的空间音频格式输入信号提取对象音频信号,其中所述基于所述所接收的空间音频格式输入信号提取对象音频信号包含确定对象音频信号和残余音频信号。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top