[发明专利]音响信号编码装置、音响信号解码装置、音响信号编码方法以及音响信号解码方法有效
申请号: | 201580015301.4 | 申请日: | 2015-07-03 |
公开(公告)号: | CN106133831B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 河岛拓也;江原宏幸 | 申请(专利权)人: | 弗朗霍弗应用研究促进协会 |
主分类号: | G10L19/035 | 分类号: | G10L19/035;G10L19/02 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 音响信号编码装置(100)包括:从输入信号输出子带频谱的时间频率变换单元(101);子带能量量化单元(102);分析子带频谱的音调性的音调计算单元(103);基于音调性的分析结果及量化子带能量,选择由第2量化单元量化的第2子带,并确定对由第1量化单元量化的第1子带分配的第1比特数的比特分配单元(104);使用由第1比特数组成的比特进行编码的第1量化单元(106);使用基音滤波器进行编码的第2量化单元(107);以及复用单元(108)。 | ||
搜索关键词: | 音响 信号 编码 装置 解码 方法 以及 | ||
【主权项】:
音响信号编码装置,包括:时间频率变换单元,将输入音响信号转换到频域并生成频谱,将所述频谱分割为每个规定的频带的子带,输出子带频谱;子带能量量化单元,对每个所述子带求量化子带能量;音调计算单元,分析所述子带频谱的音调性并输出分析结果;比特分配单元,基于所述音调性的分析结果和所述量化子带能量,从所述子带之中选择由第2量化单元中量化的第2子带,确定被分配给由第1量化单元量化的第1子带的第1比特数;以及复用单元,将包含从所述第1量化单元及所述第2量化单元输出的编码信息、所述量化子带能量和所述音调性的分析结果的信息进行复用并输出,所述第1量化单元将所述第1子带中包含的子带频谱,使用由所述第1比特数组成的比特进行脉冲编码;所述第2量化单元将所述第2子带中包含的子带频谱,使用基音滤波器进行编码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗朗霍弗应用研究促进协会,未经弗朗霍弗应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201580015301.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种可更换装饰板的洁具
- 下一篇:一种小麦面粉生产加工装置
- 同类专利
- 信号编码方法和装置以及信号解码方法和装置-201911105859.8
- 成昊相 - 三星电子株式会社
- 2014-09-16 - 2023-10-13 - G10L19/035
- 提供了一种信号编码方法和装置以及信号解码方法和装置。一种频谱编码方法可包括:基于每个频带,针对归一化的频谱选择重要频谱分量,以及基于在每个频带的基础上选择的重要频谱分量的数量、位置、大小和符号来对所述重要频谱分量的信息进行编码。一种频谱解码方法可包括:从比特流获得编码频谱的基于每个频带的重要频谱分量的信息,以及基于所述重要频谱分量的数量、位置、大小和符号,对获得的基于每个频带的重要频谱分量的信息进行解码。
- 低复杂度音调自适应音频信号量化-201910203346.4
- 马丁·迪策尔;纪尧姆·富克斯;克里斯蒂安·黑尔姆里希;戈兰·马尔科维奇 - 弗劳恩霍夫应用研究促进协会
- 2014-01-28 - 2023-08-29 - G10L19/035
- 本公开内容涉及低复杂度音调自适应音频信号量化。本发明提供一种音频编码器,其用于对音频信号进行编码,以便从中产生编码信号,该音频编码器包括:帧装置,其被配置成从该音频信号提取帧;量化器,其被配置成将从该音频信号的帧得到的频谱信号的频谱线映射至量化索引,其中,该量化器具有死区,在该死区中将该输入频谱线映射至量化索引零;以及控制装置,其被配置成修改死区;其中,控制装置包括音调计算装置,其被配置成计算用于至少一个频谱线或用于至少一组频谱线的至少一个音调指示值,其中,控制装置被配置成取决于各个音调指示值来修改用于至少一个频谱线或至少一组频谱线的死区。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199400.4
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-06-16 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199396.1
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-06-16 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199406.1
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-06-16 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199390.4
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-05-23 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码具有增强的频谱带复制元数据的音频位流-201811521218.6
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-04-04 - G10L19/035
- 公开了解码具有增强的频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199395.7
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-03-10 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码具有增强的频谱带复制元数据的音频位流-201811521245.3
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-03-10 - G10L19/035
- 公开了解码具有增强的频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199401.9
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2023-03-03 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199411.2
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2022-12-20 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 解码在填充元素中具有增强频谱带复制元数据的音频位流-201811199403.8
- L·维尔莫斯;H·普恩哈根;P·埃斯特兰德 - 杜比国际公司
- 2016-03-10 - 2022-12-16 - G10L19/035
- 公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
- 空间音频方向参数的量化-202080073332.6
- A·瓦西拉凯 - 诺基亚技术有限公司
- 2020-07-27 - 2022-05-27 - G10L19/035
- 一种用于空间音频信号编码的方法,包括:针对第一帧,获得多个音频方向参数,其中,每个参数包括仰角值和方位角值,并且其中,每个参数具有有序位置;针对先前帧,基于该先前帧的参数仰角值与更先前帧的参数仰角值之间以及该先前帧的参数方位角值与更先前帧的参数方位角值之间的差异,确定多个音频方向参数中的任何音频方向参数是否被差分编码;针对在所考虑的先前帧中没有被差分编码的任何音频方向参数,基于该帧的参数仰角值与先前帧的参数仰角值之间的差异以及该帧的参数方位角值与先前帧的参数方位角值之间的差异,生成差分参数值;针对多个音频方向参数中的每个音频方向参数,基于该音频方向参数与经旋转的导出音频方向参数之间的差异,生成差异参数值;量化该音频方向参数与经旋转的导出音频方向参数之间的差异以及该差分参数值;以及针对多个音频方向参数中的每个音频方向参数,选择经量化的差异或差分参数值。
- 音响信号编码装置和解码装置以及编码方法和解码方法-202111171436.3
- 河岛拓也;江原宏幸 - 弗朗霍弗应用研究促进协会
- 2015-07-03 - 2022-02-08 - G10L19/035
- 本公开公开了一种音响信号编码装置,包括:时间频率变换单元(101),通过对输入音响信号执行到频域的转换来生成频谱,将频谱分割为规定的频带的子带,以及输出子带频谱;子带能量量化单元(102),对每个子带求量化子带能量;音调计算单元(103),分析子带频谱的音调性并输出分析结果;比特分配单元(104),基于音调性的分析结果和量化子带能量,从子带之中选择由第2量化单元(107)对其执行量化的第2子带,以及确定要分配给子带之中的由第1量化单元(106)对其执行量化的第1子带的第1比特数;以及复用单元(108),将从第1量化单元(106)和第2量化单元(107)输出的编码信息、量化子带能量和音调性的分析结果复用成信息并输出复用信息。
- 音响信号编码装置、音响信号解码装置、音响信号编码方法以及音响信号解码方法-201580015301.4
- 河岛拓也;江原宏幸 - 弗朗霍弗应用研究促进协会
- 2015-07-03 - 2021-10-26 - G10L19/035
- 音响信号编码装置(100)包括:从输入信号输出子带频谱的时间频率变换单元(101);子带能量量化单元(102);分析子带频谱的音调性的音调计算单元(103);基于音调性的分析结果及量化子带能量,选择由第2量化单元量化的第2子带,并确定对由第1量化单元量化的第1子带分配的第1比特数的比特分配单元(104);使用由第1比特数组成的比特进行编码的第1量化单元(106);使用基音滤波器进行编码的第2量化单元(107);以及复用单元(108)。
- 一种基于深度自编码器的语音信号重建方法-201910775558.X
- 吴建锋;秦会斌;秦宏帅 - 浙江树人学院(浙江树人大学)
- 2019-08-21 - 2021-05-28 - G10L19/035
- 本发明公开了一种基于深度自编码器的语音信号重建方法,包括以下步骤:步骤S101:获取编码数据并将其输入解码单元;步骤S102:解码单元通过深度解码器神经网络对编码数据进行处理并输出解码数据;步骤S103:对解码数据进行反归一化;步骤S104:对经步骤S103处理后的数据进行离散傅里叶逆变换;步骤S105:对经步骤S104处理后的数据通过叠接相加得到重建的语音信号;其中,编码数据通过以下步骤得到:步骤S201:对原始语音信号进行分帧;步骤S202:对分帧后的数据进行离散傅里叶变换;步骤S203:对步骤S202处理的数据进行归一化;步骤S204:将经归一化的数据输入编码单元;步骤S205:编码单元通过深度编码器神经网络对经步骤S203归一化的数据进行处理得到编码数据。
- 信号编码方法和装置以及信号解码方法和装置-202010872923.1
- 成昊相;朱基岘;吴殷美 - 三星电子株式会社
- 2015-07-28 - 2020-11-20 - G10L19/035
- 公开了频谱编码方法及频谱编码装置,其中,频谱编码方法包括:基于第一量化方案对非零频带的重要频谱分量的频谱数据进行量化;从所量化的频谱数据中提取低比特;通过收集所量化的频谱数据中针对所有非零频带的低比特,生成低比特序列;基于第二量化方案量化对低比特序列进行量化;对重要频谱分量的数量、位置和符号执行第一无损编码;对通过从所量化的频谱数据中去除低比特而构造的幅度信息执行第二无损编码;对所量化的低比特序列执行第三无损编码;以及通过使用从第一无损编码、第二无损编码和第三无损编码提供的数据来生成比特流。
- 语音声响编码装置和解码装置、语音声响编码和解码方法-201710759624.5
- 刘宗宪;S.纳吉塞蒂;押切正浩 - 弗朗霍弗应用研究促进协会
- 2013-11-26 - 2020-10-13 - G10L19/035
- 本发明的语音声响编码装置包括:转换单元,将语音声响信号从时域转换到频域;估计单元,对于将语音声响信号的频谱分割所得的多个子带,分别估计表示能级的能量包络线;量化单元,将能量包络线进行量化;群组确定单元,将量化的能量包络线分组为多个群组;第一比特分配单元,对多个群组分配比特;第二比特分配单元,将对多个群组分配的比特按每个群组分配给子带;以及编码单元,使用对子带分配的比特,编码频谱。多个群组的每一个由多个子带构成,群组确定单元在确定多个群组时,将能量包络线具有极大值的子带即优势频带、以及与优势频带两侧相邻并形成能量包络线的下降梯度的子带确定为优势群组,将优势群组以外的连续的子带确定为非优势群组。
- 编码装置、解码装置、它们的方法及程序-201580064256.1
- 守谷健弘;镰本优;原田登;龟冈弘和;杉浦亮介 - 日本电信电话株式会社;国立大学法人东京大学
- 2015-11-24 - 2020-08-25 - G10L19/035
- 提供能够进行比以往效率好的编码或者解码的编码或者解码技术。将时序信号在频域中进行编码的编码装置具备:频谱包络估计单元(2A),将η设为2以外的规定的正数,将与时序信号对应的频域样本串的绝对值的η次方视为功率谱而进行频谱包络的估计;以及编码单元(2B),对与时序信号对应的频域样本串的各系数进行基于所估计出的频谱包络而改变比特分配或者实质上比特分配改变的编码。
- 编码方法、编码装置以及记录介质-201580014471.0
- 守谷健弘;镰本优;原田登 - 日本电信电话株式会社
- 2015-01-13 - 2019-08-16 - G10L19/035
- 在利用了周期性的编码方法和不利用周期性的编码方法之中,在期待码量减小的编码方法中,一边调整增益一边得到整数值序列的码量或其估计值,在并非如此的编码方法中,代用在该过程中得到的整数值序列而得到整数值序列的码量或其估计值,输出使用将它们进行比较而决定的编码方法对该整数值序列进行编码而得到的整数信号码。
- 低复杂度音调自适应音频信号量化-201480006396.9
- 马丁·迪策尔;纪尧姆·富克斯;克里斯蒂安·黑尔姆里希;戈兰·马尔科维奇 - 弗劳恩霍夫应用研究促进协会
- 2014-01-28 - 2019-04-16 - G10L19/035
- 本发明提供一种音频编码器,其用于对音频信号(AS)进行编码,以便从中产生编码信号(ES),该音频编码器(1)包括:帧装置(2),其被配置成从该音频信号(AS)提取帧(F);量化器(3),其被配置成将从该音频信号(AS)的帧(F)得到的频谱信号(SPS)的频谱线(SL1‑32)映射至量化索引(I0,I1),其中,该量化器(3)具有死区(DZ),在该死区(DZ)中将该输入频谱线(SL)映射至量化索引零(I0);以及控制装置(4),其被配置成修改死区(DZ);其中,控制装置(4)包括音调计算装置(5),其被配置成计算用于至少一个频谱线(SL1‑32)或用于至少一组频谱线(SL1‑32)的至少一个音调指示值(TI5‑32),其中,控制装置(4)被配置成取决于各个音调指示值(TI5‑32)来修改用于至少一个频谱线(SL1‑32)或至少一组频谱线(SL1‑32)的死区(DZ)。
- 自适应音频编解码系统、方法、装置及介质-201780040686.9
- J·约翰斯顿;S·怀特 - 易默森服务有限责任公司
- 2017-05-09 - 2019-03-01 - G10L19/035
- 一种编码器,其包括用于对输入音频信号进行滤波的低通滤波器。该低通滤波器具有固定的滤波系数。该编码器基于差异信号生成经量化信号。该编码器包括自适应量化器和解码器,以生成反馈信号。该解码器具有逆量化器和预测器。该预测器具有固定的控制参数,该控制参数基于该低通滤波器的频率响应。该预测器可以包括具有固定的滤波系数的有限脉冲响应滤波器。该解码器可以包括耦合在该低通滤波器和该编码器之间的自适应噪声整形滤波器。该自适应噪声整形滤波器对在对应于该低通滤波器的频谱的频谱内的信号进行整平。
- 一种提高语音传输效率的方法-201510743227.X
- 朱江章;符纪伟;江志勇;宋静 - 湖南德海通信设备制造有限公司
- 2015-11-05 - 2017-05-17 - G10L19/035
- 本发明公开了一种提高语音传输效率的方法,包括发送语音和接收语音两个步骤。发送语音的步骤是指用户经过语音接收设备采集语音模拟信号,输入到模拟/数字转换模块,将其转换为数字信号,在语音智能识别模块中经过算法处理,转变为文字,通过网络传输从发送端发出。接收语音的步骤是指接收用户将从接收端的文字转换语音模块传来的文字信号,转换为语音的数字化数据,通过模拟/数字转换模块将语音的数字化数据转成语音模拟信号,再输入到语音播放设备,使用户听到。本发明提高了实时语音传输效率,实时性传输明显改善,降低网络传输带宽要求,增加了无线传输距离。
- 一种基于流水线的三维音频编码加速方法-201410282633.6
- 张军 - 张军
- 2014-06-23 - 2015-12-30 - G10L19/035
- 本发明公开了一种基于流水线的三维音频编码加速方法,其具体步骤如下:将多声道的时域信号变换为频域信号;将各声道的频域信号均划分为多个子带;获取各子带能量,并依次将相邻的三个声道对应的子带能量组合成第一类声道单元,若剩余相邻声道不足三个,则将剩余相邻声道对应的子带能量组合成第二类声道单元;对第一类和第二类声道单元分别进行编码,量化编码结果并生成各声道单元对应的变换矩阵索引;将上述4个步骤,组成四级流水线结构,进行三维音频编码加速。
- 一种语音线性预测模型的非线性量化方法-201310538591.3
- 马占宇;肖波;司中威;郭军 - 无锡北邮感知技术产业研究院有限公司
- 2013-11-05 - 2014-03-12 - G10L19/035
- 发明公开了一种语音线性预测模型的非线性量化方法,包括:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;非线性去相关步骤:根据线谱频率参数差值的统计特性,采用结构化的方法,通过非线性变换将线谱频率参数差值去相关;计算边际概率分布步骤:利用去相关的线谱频率参数差值的统计特性,计算其边缘概率密度分布;标量量化器设计步骤:根据得到的边缘概率密度分布函数,设计基于概率密度函数的优化量化器。本发明所述语音线性预测模型的非线性量化方法,可以克服现有技术中时间复杂度高和使用效果差等缺陷,以实现时间复杂度低和使用效果好的优点。
- 用于衰减低精确度重构的信号区域的方法和解码器-201180070142.X
- 塞巴斯蒂安·内斯隆德;艾力克·诺维尔;沃洛佳·格兰恰诺夫 - 瑞典爱立信有限公司
- 2011-12-15 - 2014-01-08 - G10L19/035
- 一种用于解码器的方法,以及用于确定要应用到音频信号的衰减的衰减控制器,包括:识别要衰减的频谱区域;随后将识别出的频谱区域归在一起以形成连续频谱区域;以及自适应于带宽来应用所述连续频谱区域的衰减,使得增大的带宽减小所述连续频谱区域的衰减。
- 编码方法、解码方法、编码装置、解码装置、程序、记录介质-201280015955.3
- 守谷健弘;原田登;鎌本优;日和崎佑介;福井胜宏 - 日本电信电话株式会社
- 2012-03-26 - 2013-12-18 - G10L19/035
- 在编码处理中,对将来自音响信号的频域的样本串除以加权包络、除以增益所得的结果进行量化,从而将各样本进行可变长编码。使用此时在可变长编码中可节省的信息,对量化前的样本和量化后的样本的误差进行量化。决定根据可节省的比特数来量化哪个样本的误差的规则而进行量化。在解码处理中,对输入的码串的可变长码进行解码而获得频域的样本串,进而,以与可变长码的比特数对应的规则来解码误差信号,并从该获得的样本串基于辅助信息而获得原来的样本串。
- 专利分类