[发明专利]用于渲染音频声场表示以供音频回放的方法和设备有效

专利信息
申请号: 201710147812.2 申请日: 2013-07-16
公开(公告)号: CN107071686B 公开(公告)日: 2020-02-14
发明(设计)人: 约翰内斯·伯姆;弗洛里安·凯勒 申请(专利权)人: 杜比国际公司
主分类号: H04S3/00 分类号: H04S3/00
代理公司: 11038 中国国际贸易促进委员会专利商标事务所 代理人: 宿小猛
地址: 荷兰阿*** 国省代码: 荷兰;NL
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 渲染 音频 声场 表示 回放 方法 设备
【说明书】:

本发明公开了用于渲染音频声场表示以供音频回放的方法和设备。在针对任意的空间扩音器设置渲染音频声场表示的方法中,通过以下步骤获得用于渲染到目标扩音器的给定布置的解码矩阵(D):获得目标扬声器的数目(L)、它们的位置(I)、球形建模网格的位置(II)以及HOA阶数(N),根据建模网格的位置(II)和扬声器的位置(I)来生成(141)混合矩阵(G),根据球形建模网格的位置(II)和HOA阶来生成(142)模式矩阵(III),根据混合矩阵(G)和模式矩阵(III)计算(143)第一解码矩阵(IV),以及使用平滑和缩放系数来平滑和缩放(144、145)第一解码矩阵(IV)。

本申请是申请号为201380037816.5、申请日为2013年7月16日、发明名称为“用于渲染音频声场表示以供音频回放的方法和设备”的发明专利申请的分案申请。

技术领域

本发明涉及一种用于渲染(render)音频声场表示(具体地,涉及高保真度立体声响复制格式的音频表示)以供音频回放的方法和设备。

背景技术

精确定位是任何空间音频再现系统的关键目标。这种再现系统高度可应用于会议系统、游戏或受益于3D声音的其他虚拟环境。3D中的声音场景可被合成或捕获为自然声场。声场信号(例如,高保真度立体声响复制(Ambisonics))携带期望声场的表示。高保真度立体声响复制格式基于声场的球面谐波分解。虽然基本高保真度立体声响复制格式或B格式使用阶数0和1的球面谐波,所谓的高阶高保真度立体声响复制(HOA)还使用至少2阶的其他球面谐波。需要解码或渲染过程来从这种高保真度立体声响复制格式的信号中获得单独的扩音器信号。在本文中将扩音器的空间布置称为扩音器设置。然而,虽然已知的渲染方案仅适于常规的扩音器设置,任意的扩音器设置更加普遍。如果将这种渲染方案应用于任何扩音器设置,声音方向性受到损伤。

发明内容

本发明描述了一种用于渲染/解码针对于常规和非常规空间扩音器分布的音频声场表示的方法,其中,该渲染/解码提供了高度改进的定位特性并节省了能量。具体地,本发明提供了用于获得(例如HOA格式的)声场数据的解码矩阵的新方式。因为HOA格式描述了不直接涉及扩音器位置的声场,且因为要获得的扩音器信号必然处于基于通道的音频格式,HOA信号的解码与音频信号的渲染始终紧密相关。因此,本发明涉及解码和渲染声场相关的音频格式。

本发明的一个优点是实现节能解码以及非常好的定向特性。术语“节能”指的是在解码之后保留HOA定向信号中的能量,使得例如将以恒定的响度感知恒定幅度定向空间扫描。术语“好的定向特性”指的是通过定向的主波瓣和较小的副波瓣来表征的扬声器方向性,其中,与常规的渲染/解码相比,提高了方向性。

本发明公开了针对任意的扩音器设置渲染声场信号(例如,高阶高保真度立体声响复制(HOA)),其中,该渲染导致高度改进的定位特性,且是节能的。这是通过用于声场数据的新类型的解码矩阵以及用于获得解码矩阵的新方式来获得的。在针对任意的空间扩音器设置渲染音频声场表示的方法中,通过以下步骤获得针对目标扩音器的给定布置进行渲染的解码矩阵:获得目标扬声器的数目及它们的位置、球面建模网格的位置以及HOA阶数,根据建模网格的位置和扬声器的位置来生成混合矩阵,根据球面建模网格的位置和HOA阶数来生成模式矩阵,根据混合矩阵和模式矩阵计算第一解码矩阵,以及使用平滑和缩放系数来平滑和缩放第一解码矩阵,以获得节能的解码矩阵。

在一个实施例中,如权利要求1中所述,本发明涉及一种用于解码和/或渲染音频声场表示以供音频回放的方法。在另一实施例中,如权利要求9中所述,本发明涉及一种用于解码和/或渲染音频声场表示以供音频回放的设备。在又一实施例中,如权利要求15中所述,本发明涉及其上存储可执行指令的计算机可读介质,所述可执行指令使计算机执行一种用于解码和/或渲染音频声场表示以供音频回放的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710147812.2/2.html,转载请声明来源钻瓜专利网。

同类专利
  • 用于渲染音频声场表示以供音频回放的方法和设备-201710147809.0
  • 约翰内斯·伯姆;弗洛里安·凯勒 - 杜比国际公司
  • 2013-07-16 - 2020-02-14 - H04S3/00
  • 本发明公开了用于渲染音频声场表示以供音频回放的方法和设备。在针对任意的空间扩音器设置渲染音频声场表示的方法中,通过以下步骤获得用于渲染到目标扩音器的给定布置的解码矩阵(D):获得目标扬声器的数目(L)、它们的位置(I)、球形建模网格的位置(II)以及HOA阶数(N),根据建模网格的位置(II)和扬声器的位置(I)来生成(141)混合矩阵(G),根据球形建模网格的位置(II)和HOA阶来生成(142)模式矩阵(III),根据混合矩阵(G)和模式矩阵(III)计算(143)第一解码矩阵(IV),以及使用平滑和缩放系数来平滑和缩放(144、145)第一解码矩阵(IV)。
  • 用于渲染音频声场表示以供音频回放的方法和设备-201710147810.3
  • 约翰内斯·伯姆;弗洛里安·凯勒 - 杜比国际公司
  • 2013-07-16 - 2020-02-14 - H04S3/00
  • 本发明公开了用于渲染音频声场表示以供音频回放的方法和设备。在针对任意的空间扩音器设置渲染音频声场表示的方法中,通过以下步骤获得用于渲染到目标扩音器的给定布置的解码矩阵(D):获得目标扬声器的数目(L)、它们的位置(I)、球形建模网格的位置(II)以及HOA阶数(N),根据建模网格的位置(II)和扬声器的位置(I)来生成(141)混合矩阵(G),根据球形建模网格的位置(II)和HOA阶来生成(142)模式矩阵(III),根据混合矩阵(G)和模式矩阵(III)计算(143)第一解码矩阵(IV),以及使用平滑和缩放系数来平滑和缩放(144、145)第一解码矩阵(IV)。
  • 用于渲染音频声场表示以供音频回放的方法和设备-201710147812.2
  • 约翰内斯·伯姆;弗洛里安·凯勒 - 杜比国际公司
  • 2013-07-16 - 2020-02-14 - H04S3/00
  • 本发明公开了用于渲染音频声场表示以供音频回放的方法和设备。在针对任意的空间扩音器设置渲染音频声场表示的方法中,通过以下步骤获得用于渲染到目标扩音器的给定布置的解码矩阵(D):获得目标扬声器的数目(L)、它们的位置(I)、球形建模网格的位置(II)以及HOA阶数(N),根据建模网格的位置(II)和扬声器的位置(I)来生成(141)混合矩阵(G),根据球形建模网格的位置(II)和HOA阶来生成(142)模式矩阵(III),根据混合矩阵(G)和模式矩阵(III)计算(143)第一解码矩阵(IV),以及使用平滑和缩放系数来平滑和缩放(144、145)第一解码矩阵(IV)。
  • 用于渲染音频声场表示以供音频回放的方法和设备-201710147821.1
  • 约翰内斯·伯姆;弗洛里安·凯勒 - 杜比国际公司
  • 2013-07-16 - 2020-02-14 - H04S3/00
  • 本发明公开了用于渲染音频声场表示以供音频回放的方法和设备。在针对任意的空间扩音器设置渲染音频声场表示的方法中,通过以下步骤获得用于渲染到目标扩音器的给定布置的解码矩阵(D):获得目标扬声器的数目(L)、它们的位置(I)、球形建模网格的位置(II)以及HOA阶数(N),根据建模网格的位置(II)和扬声器的位置(I)来生成(141)混合矩阵(G),根据球形建模网格的位置(II)和HOA阶来生成(142)模式矩阵(III),根据混合矩阵(G)和模式矩阵(III)计算(143)第一解码矩阵(IV),以及使用平滑和缩放系数来平滑和缩放(144、145)第一解码矩阵(IV)。
  • 兼容现有音视频系统的三维声信号的编码器及其方法-201611171106.3
  • 潘兴德;陈笑天;吴超刚 - 南京青衿信息科技有限公司
  • 2016-12-16 - 2020-02-14 - H04S3/00
  • 本发明公开一种兼容现有音视频系统的三维声信号的编码器及其方法,包括下混及基础声道划分模块,用于接收基础声道和/或声音对象,按照下混方案进行下混和基础声道划分操作,输出下混兼容基础声道、扩展基础声道、基础声道划分边信息;兼容编码模块,用于接收下混兼容基础声道,输出下混兼容基础声道编码数据;扩展编码模块,用于接收声音对象、下混方案、扩展基础声道、基础声道划分边信息,输出扩展编码数据;打包模块,用于接收下混兼容基础声道编码数据和扩展编码数据,进行分别打包输出或者混合打包输出三维声数据码流。本发明能够更好地兼容已有音视频系统的编码和解码方法,同时具备三维声编解码的能力。
  • 用于创作和渲染音频再现数据的非暂态介质和设备-201710507397.7
  • 安东尼奥·马特奥斯舒莱;尼古拉斯·R·泰辛戈斯 - 杜比实验室特许公司;杜比国际公司
  • 2014-03-10 - 2020-02-07 - H04S3/00
  • 公开了用于创作和渲染音频再现数据的非暂态介质和设备。可以针对音频对象在其内可以移动的空间限定多个虚拟源位置。用于渲染音频数据的建立步骤可以包括:接收再现扬声器位置数据并且根据再现扬声器位置数据和每个虚拟源位置预先计算每个虚拟源的增益值。增益值可以在“运行时”期间被存储和使用,在“运行时”期间针对再现环境的扬声器渲染音频再现数据。在运行时期间,针对每个音频对象,可以计算来自由音频对象位置数据和音频对象大小数据限定的区域或空间内的虚拟源位置的贡献。可以至少部分地基于所计算出的贡献计算再现环境的每个输出声道的一组增益值。每个输出声道可以与再现环境的至少一个再现扬声器相对应。
  • 音频播放系统以及可形成球形环绕声场的音频播放室-201822082932.1
  • 邹世冬;俞红雨 - 冬雨(北京)国际生物科技有限公司
  • 2018-12-12 - 2019-12-31 - H04S3/00
  • 本实用新型提供一种音频播放系统以及可形成球形环绕声场的音频播放室,包括播放器、低音音箱以及5个中高音音箱,所述播放器包括与所述各音箱一一对应的音频输出端子,所述播放器中设置有处理器以及音频存储器,所述音频存储器用于存储由6路音频信号组成的音频文件,当选择某音频文件后,所述处理器得以将其每路音频信号送至相对应的低音音箱或中高音音箱中,并转换为声音并输出该声音,所述5个中高音音箱中的4个中高音音箱分别设置于十字结构的四个端点处,另一个中高音音箱设置于十字结构的上方,这使得由所述音频播放系统播放音频时形成类似球形的全方位音乐场,以发挥其对于人体具有针对性的调养生自的作用。
  • 虚拟环绕声处理方法和装置-201810154054.1
  • 邢文峰 - 青岛海信电器股份有限公司
  • 2018-02-22 - 2019-12-24 - H04S3/00
  • 本发明实施例提供一种虚拟环绕声处理方法和装置。本发明的虚拟环绕声处理方法,包括:根据左声道的频谱信号和右声道的频谱信号确定第一差值信号和第二差值信号;分别对第一差值信号和第二差值信号进行相位偏移,得到第一目标差值信号和第二目标差值信号;根据所述左声道的频谱信号、所述右声道的频谱信号、所述第一目标差值信号和所述第二目标差值信号,生成处理后的左声道信号和处理后的右声道信号;输出所述处理后的左声道信号和所述处理后的右声道信号。本发明实施例可以实现虚拟环绕声效技术的临场感,且虚拟环绕声效果与用户所在位置无关,可以提升用户使用体验。
  • 利用多信道传输三维声信号的编解码器及其编解码方法-201611171107.8
  • 潘兴德;陈笑天;吴超刚 - 南京青衿信息科技有限公司
  • 2016-12-16 - 2019-12-17 - H04S3/00
  • 本发明公开一种利用多信道传输三维声信号的编解码器及其编解码方法,包括:下混及基础声道划分模块,用于接收基础声道和/或声音对象,按照下混方案进行下混和基础声道划分操作,输出下混兼容基础声道数据、扩展基础声道、基础声道划分边信息;扩展编码模块用于接收声音对象、下混方案、扩展基础声道、基础声道划分边信息,输出扩展编码数据;DCP打包模块,用于接收下混兼容基础声道数据并按照DCP规范打成DCP码流;扩展编码数据打包模块,用于接收扩展编码数据,输出扩展编码数据码流。本发明能够兼容现有符合DCP协议的电影服务器进行直接播放,同时在用三维声处理器播放时,能够实现影院的三维声回放。
  • 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频-201711094042.6
  • 颜冠杰;D·J·布里巴特;G·A·戴维森;R·威尔森;D·M·库珀;双志伟 - 杜比实验室特许公司
  • 2014-12-18 - 2019-12-13 - H04S3/00
  • 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
  • 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频-201711094047.9
  • 颜冠杰;D·J·布里巴特;G·A·戴维森;R·威尔森;D·M·库珀;双志伟 - 杜比实验室特许公司
  • 2014-12-18 - 2019-12-13 - H04S3/00
  • 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
  • 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置-201710587980.3
  • F.基勒;J.贝姆 - 杜比国际公司
  • 2013-03-20 - 2019-12-03 - H04S3/00
  • 本公开涉及从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置。立体声扬声器设置的立体混响声表示的解码被称为一阶立体混响声。但是这种一阶立体混响声方式要么具有高负旁瓣,要么具有在前面区域中的不良定位。本发明处理更高阶立体混响声HOA的立体声解码器的处理。期望平移函数可以从扬声器之间的虚拟源的位移的平移定律而推导。对于每一个扬声器,定义在采样点的全部可能输入方向的期望平移函数。平移函数通过圆形谐波函数接近,并且随着立体混响声阶增大,以减小的误差匹配期望平移函数。对于扬声器之间的前面区域,使用如正切定律或向量基幅度平移(VBAP)的平移定律。对于后面区域,定义具有来自这些方向的声音的轻微衰减的平移函数。
  • 用于处理音频信号的方法和移动装置-201380080499.5
  • 彼得·格罗舍;郎玥 - 华为技术有限公司
  • 2013-10-30 - 2019-11-22 - H04S3/00
  • 一种用于处理音频信号的方法(900),所述方法包含:将包括空间信息的音频信号(602a,602b)分解(901)成一组音频信号成分;以及根据第一处理方案(603)处理(902)所述音频信号成分的组的第一子集(606a)且根据不同于所述第一处理方案(603)的第二处理方案(609)处理所述音频信号成分的组的第二子集(606),其中所述第一子集(606a)包括对应于至少一个正面信号源(M)的音频信号成分并且所述第二子集(606)包括对应于至少一个环境信号源(SL,SR)的音频信号成分;其中所述第二处理方案(609)是基于串扰抵销。
  • 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置-201710587967.8
  • F.基勒;J.贝姆 - 杜比国际公司
  • 2013-03-20 - 2019-11-15 - H04S3/00
  • 本公开涉及从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置。立体声扬声器设置的立体混响声表示的解码被称为一阶立体混响声。但是这种一阶立体混响声方式要么具有高负旁瓣,要么具有在前面区域中的不良定位。本发明处理更高阶立体混响声HOA的立体声解码器的处理。期望平移函数可以从扬声器之间的虚拟源的位移的平移定律而推导。对于每一个扬声器,定义在采样点的全部可能输入方向的期望平移函数。平移函数通过圆形谐波函数接近,并且随着立体混响声阶增大,以减小的误差匹配期望平移函数。对于扬声器之间的前面区域,使用如正切定律或向量基幅度平移(VBAP)的平移定律。对于后面区域,定义具有来自这些方向的声音的轻微衰减的平移函数。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top