[发明专利]音频处理单元、由音频处理单元执行的方法和存储介质在审

专利信息
申请号: 201910831687.6 申请日: 2013-07-31
公开(公告)号: CN110600043A 公开(公告)日: 2019-12-20
发明(设计)人: 杰弗里·里德米勒;迈克尔·沃德 申请(专利权)人: 杜比实验室特许公司
主分类号: G10L19/008 分类号: G10L19/008;G10L19/16
代理公司: 11227 北京集佳知识产权代理有限公司 代理人: 唐京桥;杨林森
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开涉及音频处理单元、由音频处理单元执行的方法和存储介质。一种用于包括通过将子流结构元数据(SSM)和/或节目信息元数据(PIM)以及音频数据包括在比特流中来生成编码音频比特流的设备和方法。其他方面是用于对这样的比特流进行解码的设备和方法,以及被配置成(例如,被编程成)执行该方法的任意实施方式或包括存储根据该方法的任意实施方式而生成的音频比特流的至少一个帧的缓冲存储器的音频处理单元(例如,编码器、解码器或后处理器)。
搜索关键词: 音频处理单元 比特流 解码器 缓冲存储器 音频比特流 解码 编码音频 存储介质 后处理器 节目信息 音频数据 编码器 结构元 元数据 子流 编程 存储 配置
【主权项】:
1.一种音频处理单元,包括:/n一个或更多个处理器;/n存储器,其耦接至所述一个或更多个处理器并且被配置成存储指令,所述指令在由所述一个或更多个处理器执行时使所述一个或更多个处理器执行操作,所述操作包括:/n接收包括音频节目的编码音频比特流,所述编码音频比特流包括一个或更多个音频通道的集合的编码音频数据以及与音频通道的所述集合相关联的元数据,其中所述元数据包括动态范围控制DRC元数据、响度元数据以及指示音频通道的所述集合中的通道的数量的元数据,其中所述DRC元数据包括DRC值以及指示用于生成所述DRC值的DRC配置文件的DRC配置文件元数据,并且其中所述响度元数据包括指示所述音频节目的响度的元数据;/n对所述编码音频数据进行解码以获得音频通道的所述集合的解码音频数据;/n从所述编码音频比特流的元数据中获得所述DRC值以及指示所述音频节目的响度的元数据;以及/n响应于所述DRC值以及指示所述音频节目的响度的元数据,修改音频通道的所述集合的所述解码音频数据。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910831687.6/,转载请声明来源钻瓜专利网。

同类专利
  • 语音信号的发送方法、装置、设备及可读存储介质-201911076446.1
  • 曹木勇;周佳庆 - 腾讯科技(深圳)有限公司
  • 2019-11-06 - 2020-02-11 - G10L19/008
  • 本申请公开了一种语音信号的发送方法、装置、设备及可读存储介质,涉及多媒体处理领域。该方法包括:对目标语音信号中的语音帧进行人声概率检测,得到人声帧;获得第一人声帧和第二人声帧,第一人声帧的人声概率大于或者等于第一要求概率,第二人声帧的人声概率小于第一要求概率;将第二人声帧归一化为静音帧;对第一人声帧和静音帧进行变长编码;对音频编码流进行发送。在对目标语音信号进行编码之前,对该目标语音信号中人声概率较低的第二人声帧归一化为静音帧,并对目标语音信号通过变长编码方式编码,静音帧的编码结果长度小于第二人声帧的编码结果长度,减小编码长度,降低该目标语音信号在发送过程中的带宽占用。
  • 声场的经分解表示的压缩-201910693832.9
  • 迪潘让·森;刘尚忆 - 高通股份有限公司
  • 2014-05-29 - 2020-02-07 - G10L19/008
  • 本申请涉及声场的经分解表示的压缩。大体来说,本发明描述用于压缩声场的经分解表示的技术。一种包括一个或多个处理器的装置可经配置以执行所述技术。所述一或多个处理器可经配置以获得包括声场的空间分量的经压缩版本的位流,所述空间分量是通过相对于多个球谐系数执行基于向量的合成而产生。
  • 多声道音频信号的去相关编码方法和装置-201611167078.8
  • 闫建新;王磊 - 广州广晟数码技术有限公司
  • 2016-12-16 - 2020-02-04 - G10L19/008
  • 本发明涉及一种多声道音频信号的去相关编码方法和装置。本发明的去相关编码方法利用多声道音频信号的声道间相关性,通过自适应的声道配置结构和自适应的声道单元编码方式进行编码,可以在低复杂度条件下有效地去除声道间的冗余,从而获得较高的编码增益。本发明比M/S编码效率高,比正交变换编码或预测编码实现简单,适用于超高清电视的3D音频系统或者其他需要3D音频的应用领域。
  • 一种对语音编解码技术的评判方法、装置及终端-201511022924.2
  • 于洪涛;刘宏波;谢磊 - 哈尔滨海能达科技有限公司
  • 2015-12-30 - 2020-01-31 - G10L19/008
  • 本发明实施例公开了一种对语音编解码技术的评判方法、装置及终端,所述方法包括:利用任一种语音编解码技术对一段原始语音进行编解码后,得到一段编解码后的语音;计算所述原始语音与所述编解码后的语音的包络方差;根据所述包络方差对所述语音编解码技术的编解码效果进行评判。本发明利用数字化的方法对不同的语音编解码技术进行评判,排除人为主观因素的影响,得到较准确的评判结果。
  • 多声道音频处理方法、装置、计算机可读存储介质和终端-201810356173.5
  • 黄传增 - 北京微播视界科技有限公司
  • 2018-04-19 - 2020-01-24 - G10L19/008
  • 本发明公开了一种多声道音频处理方法、多声道音频处理装置、多声道音频处理硬件装置、计算机可读存储介质和多声道音频处理终端。其中,该多声道音频处理方法包括:接收待处理多声道音频;检测待处理多声道音频的音频特性;基于检测结果,确定待处理多声道音频的处理参数;基于处理参数,对待处理多声道音频进行处理。本发明实施例通过采取上述技术方案,先检测多声道音频的音频特性;然后,根据该音频特性确定出处理参数;最后基于所确定的处理参数对待处理多声道音频进行处理,由此通过检测出的待处理多声道音频的音频特性并进行相应处理,解决了如何自适应地处理多声道音频的技术问题,而且还提高了用户体验效果。
  • 一种全景声处理方法-201610157032.1
  • 潘兴德;吴超刚 - 南京青衿信息科技有限公司
  • 2016-03-18 - 2020-01-24 - G10L19/008
  • 本发明公开了一种全景声处理方法,包括:获取声场空间的声音对象;以监听点为为原点建立三维坐标系,确定声音对象的三维坐标值原点建立三维坐标系,确定声音对象的三维坐标值;将声音对象的三维坐标值按时间顺序划分为参考块和预测块;对参考块的三维坐标值进行直接编码,对预测块的三维坐标值进行差分编码;根据编码前或解码后的声音对象三维坐标值确定声音对象的有效作用区域。本发明提供了三维声场的声音对象在录音制作、编码、解码和渲染回放时的坐标定义、运动轨迹和作用区域表示方法,编码效率高、声音表现力好且声音制作方便。
  • 一种多通道语音信号同步方法及装置-201510321268.X
  • 王育军 - 乐融致新电子科技(天津)有限公司
  • 2015-06-12 - 2020-01-17 - G10L19/008
  • 本发明提供一种多通道语音信号同步方法及装置。方法包括:选定通道作为模板通道,生成相应的语音信号能量包络模板;分别将各其他通道的语音信号与所述能量包络模板进行匹配,以分别确定所述各其他通道的语音信号与所述模板通道的语音信号之间的偏移值;根据所述偏移值,分别将所述各其他通道的语音信号与所述模板通道的语音信号进行同步。本发明解决了现有技术采用人工手动调整的方式,对多通道语音信号进行同步不仅浪费人力资源,而且效率很低的问题。
  • 嘈杂环境下语音输出接收设备-201910965457.9
  • 吴俊;段升顺;李颖慧 - 东南大学
  • 2019-10-11 - 2020-01-03 - G10L19/008
  • 本发明公开了一种嘈杂环境下语音输出接收设备,包括:语音获取模块,用于获取说话时喉结的振动信号,并将其转换为电信号;语音处理模块,接收所述语音获取模块传输的电信号,通过模数转换单元将模拟信号转换为数字信号,并进行压缩编码;语音传输模块,将语音处理模块处理后的语言信号进行路由传输;语音接收模块,接收音传输模块传输的语言信号,并对其进行解码,得到准确的电信号;语音输出模块,接收所述语音接收模块传递的电信号,处理并输出语言。本发明与传统的以空气为介质的麦克风获取语音信号相比,极大的提高了嘈杂环境下语音信号的信噪比,具有更优异的性能和鲁棒性;成本远,灵活性更高,易于批量生产。
  • 音频处理单元、由音频处理单元执行的方法和存储介质-201910831687.6
  • 杰弗里·里德米勒;迈克尔·沃德 - 杜比实验室特许公司
  • 2013-07-31 - 2019-12-20 - G10L19/008
  • 本公开涉及音频处理单元、由音频处理单元执行的方法和存储介质。一种用于包括通过将子流结构元数据(SSM)和/或节目信息元数据(PIM)以及音频数据包括在比特流中来生成编码音频比特流的设备和方法。其他方面是用于对这样的比特流进行解码的设备和方法,以及被配置成(例如,被编程成)执行该方法的任意实施方式或包括存储根据该方法的任意实施方式而生成的音频比特流的至少一个帧的缓冲存储器的音频处理单元(例如,编码器、解码器或后处理器)。
  • 主成分分析PCA映射模型的编解码方法及装置-201410710991.2
  • 吴超刚;潘兴德 - 北京天籁传音数字技术有限公司
  • 2014-11-28 - 2019-12-20 - G10L19/008
  • 本发明涉及一种主成分分析PCA映射模型的编解码方法及装置,该编码方法包括:对频带划分后的各频带进行频带组合处理,获得各频带组;为所述各频带组中的每个频带组确定第一映射矩阵,所述第一映射矩阵为所述频带组中的各频带共用的一组PCA映射模型的映射矩阵;对所述第一映射矩阵进行量化编码。由上可见,本发明实施例在对PCA映射模型进行编码时,不是对频带划分后的每个频带对应的映射矩阵进行编码,而是通过频带组合处理,将需要编码的映射矩阵数量由原来的每个频带对应的映射矩阵减少为每个频带组对应的映射矩阵,从而有效地降低了编码码率。
  • 一种基于SPDIF协议的数据传输方法和收发装置-201610285567.7
  • 刘少伟 - 青岛海信电器股份有限公司
  • 2016-04-29 - 2019-12-20 - G10L19/008
  • 本发明实施例涉及通信领域,尤其涉及一种基于SPDIF协议的数据传输方法和装置,用于仅仅使用一根连接线实现音频数据的传输和控制数据的双向传输。本发明实施例中,第一收发装置包括第一子收发器和SPDIF发送器,以及与第一子收发器和SPDIF发送器选择性择一连接的第一开关的一端,如此,在确定当前需发送音频数据时,通过与第一开关连通的SPDIF发送器发送数据子帧的音频数据;在确定数据子帧的音频数据发送完成之后,将第一开关与第一子收发器连通,通过第一子收发器传输控制数据。
  • 摄像头音频输入装置、去噪方法和摄像头-201610365949.0
  • 熊道云 - 北京视觉世界科技有限公司
  • 2016-05-27 - 2019-12-13 - G10L19/008
  • 本发明公开了一种摄像头音频输入装置、去噪方法和摄像头。该摄像头音频输入装置包括:音频采集模块,用于采集环境声音,并将环境声音转换为模拟音频信号;编码模块,用于将模拟音频信号转换为数字音频信号并进行编码输出;功放模块,用于对编码后的数字音频信号进行放大后输出;处理模块,用于依据第一触发条件输出第一增益值至所述编码模块以降低其增益,且用于依据第一触发条件输出第二增益值至所述功放模块以提高其增益。本发明降低了音频信号的噪声,提升了音质。
  • 数字音频编码中码率分配的方法和装置-201611217367.4
  • 闫建新;王磊 - 广州广晟数码技术有限公司
  • 2016-12-26 - 2019-12-13 - G10L19/008
  • 本发明涉及数字音频编码中码率分配的方法和装置。所述方法选择一组特定的调整系数对一个声道内从低频到高频各子带的掩蔽门限进行自适应调整以实现声道内的自适应码率分配,所述方法根据各个声道的特性进行声道间的自适应码率分配,所述方法选择一特定的权重系数对混合的高频信号部分的掩蔽门限进行自适应调整以实现强度立体声编码时的自适应码率分配。通过这些自适应码率分配方法,本发明可以获得更好的主观声音质量。
  • 一种音频传输的自适应方法及装置-201510047890.6
  • 刘霖;赵旭;刘聪 - 中国移动通信集团公司
  • 2015-01-29 - 2019-12-13 - G10L19/008
  • 本发明公开了一种音频传输的自适应方法及装置,其方法包括:获取与流媒体客户端之间的当前网络的传输速率;根据待传输的音频流在预定编码策略下的音频帧的比特数与传输速率,计算音频帧的传输时间;判断传输时间是否超出一预设的传输时延阈值;若未超出,按照预定编码策略,对音频流进行编码后并发送至向流媒体客户端;若超出,则调整预定编码策略,降低音频流编码后的音频帧的比特数,并将编码后的音频流发送至流媒体客户端。本发明通过网络的当前传输速率与预设的传输时延阈值的关系,来调整音频流的编码策略,以使音频传输适应当前网络的传输速率,解决了因网络抖动或网络不稳定而造成的高于标准要求的时延,进而影响设备之间配合异常的问题。
  • 使用估计的空间参数的音频信号增强-201480008591.5
  • M·费勒斯;V·麦尔考特;颜冠傑;G·A·戴维森;M·F·戴维斯 - 杜比实验室特许公司
  • 2014-01-22 - 2019-12-06 - G10L19/008
  • 所接收的音频数据可包括第一组频率系数和第二组频率系数。可至少部分地基于所述第一组频率系数的至少一部分来估计用于所述第二组频率系数的至少一部分的空间参数。所估计的空间参数可应用于所述第二组频率系数以生成经修正的第二组频率系数。所述第一组频率系数可对应于第一频率范围(例如,单独通道频率范围),而所述第二组频率系数可对应于第二频率范围(例如,耦合通道频率范围)。复合耦合通道的组合频率系数可基于两个或更多个通道的频率系数。第一通道的频率系数与组合频率系数之间的互相关系数可被计算。
  • 基于参数化超增益波束形成器的音频信号提取方法及装置-201610545565.7
  • 陈景东;黄公平;雅各布·贝内斯蒂 - 西北工业大学
  • 2016-07-12 - 2019-12-03 - G10L19/008
  • 本发明提供了一种基于参数化超增益波束形成器的音频信号提取方法及装置,其中方法包括:获取传感器阵列的结构信息,基于传感器阵列的结构信息,构造各向同性噪声的归一化自相关矩阵;在归一化自相关矩阵中引入参数,根据引入参数后的归一化自相关矩阵构建参数化超增益波束形成器;获取传感器阵列中各个传感器采集到的音频信号,该音频信号为时域信号;利用参数化超增益波束形成器对音频信号进行提取,得到来自期望方向的音频信号。通过本发明中的基于参数化超增益波束形成器的音频信号提取方法及装置,只需要在一个很小的范围内选取一个合适的参数,就能够在白噪声增益和指向性因子之间获得很好地平衡,实施简单,实用性强。
  • 利用沉浸式音频元数据中的元数据冗余-201580012140.3
  • C·费尔奇;H·普恩哈根;J·波普;M·沃尔特斯 - 杜比国际公司
  • 2015-04-01 - 2019-11-26 - G10L19/008
  • 本文档涉及音频编码和解码领域。具体地,本文档涉及包括音频对象的音频场景的编码和解码。描述了用于编码与音频场景(102)的多个音频对象(106a)相关的元数据的方法(400)。元数据包括第一组(114、314)元数据和第二组(104)元数据。第一和第二组(104、114、314)元数据包括一个或多个数据元素,这一个或多个数据元素指示多个音频对象(106a)的音频对象(106a)的属性和/或指示根据多个音频对象(106a)得出的下混信号(112)的属性。该方法(400)包括识别(401)对于第一和第二组(104、114、314)元数据是共用的冗余数据元素。此外,该方法包括通过参考第一组(114、314)元数据外部的一组(104)元数据的冗余数据元素来编码(402)第一组(114、314)元数据的冗余数据元素。
  • 音频处理单元和对编码音频比特流进行解码的方法-201910831662.6
  • 杰弗里·里德米勒;迈克尔·沃德 - 杜比实验室特许公司
  • 2013-07-31 - 2019-11-22 - G10L19/008
  • 本公开涉及音频处理单元和对编码音频比特流进行解码的方法。一种用于包括通过将子流结构元数据(SSM)和/或节目信息元数据(PIM)以及音频数据包括在比特流中来生成编码音频比特流的设备和方法。其他方面是用于对这样的比特流进行解码的设备和方法,以及被配置成(例如,被编程成)执行该方法的任意实施方式或包括存储根据该方法的任意实施方式而生成的音频比特流的至少一个帧的缓冲存储器的音频处理单元(例如,编码器、解码器或后处理器)。
  • 音频处理单元、由音频处理单元执行的方法和存储介质-201910832003.4
  • 杰弗里·里德米勒;迈克尔·沃德 - 杜比实验室特许公司
  • 2013-07-31 - 2019-11-22 - G10L19/008
  • 本公开涉及音频处理单元、由音频处理单元执行的方法和存储介质。一种用于包括通过将子流结构元数据(SSM)和/或节目信息元数据(PIM)以及音频数据包括在比特流中来生成编码音频比特流的设备和方法。其他方面是用于对这样的比特流进行解码的设备和方法,以及被配置成(例如,被编程成)执行该方法的任意实施方式或包括存储根据该方法的任意实施方式而生成的音频比特流的至少一个帧的缓冲存储器的音频处理单元(例如,编码器、解码器或后处理器)。
  • 音频处理单元、音频解码方法和存储介质-201910832004.9
  • 杰弗里·里德米勒;迈克尔·沃德 - 杜比实验室特许公司
  • 2013-07-31 - 2019-11-19 - G10L19/008
  • 本公开涉及音频处理单元、音频解码方法和存储介质。一种用于包括通过将子流结构元数据(SSM)和/或节目信息元数据(PIM)以及音频数据包括在比特流中来生成编码音频比特流的设备和方法。其他方面是用于对这样的比特流进行解码的设备和方法,以及被配置成(例如,被编程成)执行该方法的任意实施方式或包括存储根据该方法的任意实施方式而生成的音频比特流的至少一个帧的缓冲存储器的音频处理单元(例如,编码器、解码器或后处理器)。
  • 音频处理单元以及用于对编码音频比特流进行解码的方法-201910831663.0
  • 杰弗里·里德米勒;迈克尔·沃德 - 杜比实验室特许公司
  • 2013-07-31 - 2019-11-15 - G10L19/008
  • 本公开涉及音频处理单元以及用于对编码音频比特流进行解码的方法。一种用于包括通过将子流结构元数据(SSM)和/或节目信息元数据(PIM)以及音频数据包括在比特流中来生成编码音频比特流的设备和方法。其他方面是用于对这样的比特流进行解码的设备和方法,以及被配置成(例如,被编程成)执行该方法的任意实施方式或包括存储根据该方法的任意实施方式而生成的音频比特流的至少一个帧的缓冲存储器的音频处理单元(例如,编码器、解码器或后处理器)。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top