[发明专利]用于定向声源的编码及解码的方法、设备及系统在审
| 申请号: | 201980013721.7 | 申请日: | 2019-04-15 |
| 公开(公告)号: | CN111801732A | 公开(公告)日: | 2020-10-20 |
| 发明(设计)人: | N·R·钦格斯;M·R·P·托马斯;C·费尔施 | 申请(专利权)人: | 杜比实验室特许公司;杜比国际公司 |
| 主分类号: | G10L19/008 | 分类号: | G10L19/008;H04S1/00;H04S5/00 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 陈甜甜 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 定向 声源 编码 解码 方法 设备 系统 | ||
1.一种用于对定向音频数据进行编码的方法,其包括:
接收对应于音频对象的单声道音频信号及对应于所述音频对象的辐射模式的表示,所述辐射模式包括对应于多个采样时间、多个频带及多个方向的声级;
对所述单声道音频信号进行编码;及
对源辐射模式进行编码以确定辐射模式元数据;
其中所述辐射模式的所述编码包括确定所述辐射模式的所述表示的球面调和变换并压缩所述球面调和变换以获得经编码辐射模式元数据。
2.根据权利要求1所述的方法,其进一步包括基于音频对象的集群来对多个定向音频对象进行编码,其中所述辐射模式表示反映针对每一频带的平均声级值的质心。
3.根据权利要求2所述的方法,其中所述多个定向音频对象经编码为单个定向音频对象,其方向性与每一音频对象的球面调和系数的时变能量加权平均值相对应。
4.根据权利要求2或权利要求3所述的方法,其中所述经编码辐射模式元数据指示音频对象的集群的位置,其为每一音频对象的所述位置的平均值。
5.根据权利要求1到4中任一权利要求所述的方法,其进一步包括对有关定向音频对象的群组的辐射模式的群组元数据进行编码。
6.根据权利要求1到5中任一权利要求所述的方法,其中所述源辐射模式在基于每一频率的方向上经重新缩放为所述输入辐射模式的振幅以确定归一化辐射模式。
7.根据权利要求1到6中任一权利要求所述的方法,其中压缩所述球面调和变换包括:奇异值分解方法、主成分分析、离散余弦变换、与数据无关的基或消除所述球面调和变换的高于球面调和系数的阈值阶的球面调和系数中的至少一者。
8.一种用于对音频数据进行解码的方法,其包括:
接收经编码核心音频信号、经编码辐射模式元数据及经编码音频对象元数据;
对所述经编码核心音频信号进行解码以确定核心音频信号;
对所述经编码辐射模式元数据进行解码以确定经解码辐射模式;
对所述音频对象元数据进行解码;及
基于所述音频对象元数据及所述经解码辐射模式渲染所述核心音频信号。
9.根据权利要求8所述的方法,其中所述音频对象元数据包含时变3自由度DoF或6DoF源取向信息中的至少一者。
10.根据权利要求8或权利要求9所述的方法,其中所述核心音频信号包括基于对象的集群的多个定向对象,且其中所述经解码辐射模式表示反映针对每一频带的平均值的质心。
11.根据权利要求8到10中任一权利要求所述的方法,其中所述渲染基于将至少部分基于所述经解码辐射数据的子带增益应用于所述经解码核心音频信号。
12.根据权利要求8到11中任一权利要求所述的方法,其中所述经编码辐射模式元数据与球面调和系数的时变及频变组相对应。
13.根据权利要求8到12中的任一权利要求所述的方法,其中所述经编码辐射模式元数据包括音频对象类型元数据。
14.根据权利要求13所述的方法,其中所述音频对象类型元数据指示参数方向性模式数据,且其中所述参数方向性模式数据包含选自由余弦函数、正弦函数或心形函数组成的函数列表的一或多个函数。
15.根据权利要求13所述的方法,其中所述音频对象类型元数据指示数据库方向性模式数据,且其中对所述经编码辐射模式元数据进行解码以确定所述经解码辐射模式包括查询包含音频对象类型及对应方向性模式数据的方向性数据结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980013721.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:等离子体蚀刻方法和等离子体蚀刻装置
- 下一篇:基板处理系统和基板处理方法





