[发明专利]音频编码器、音频解码器及相关方法有效

专利信息
申请号: 201910689687.7 申请日: 2014-07-15
公开(公告)号: CN110660410B 公开(公告)日: 2023-10-24
发明(设计)人: 萨沙·迪施;弗雷德里克·纳格尔;拉尔夫·盖格尔;巴拉吉·纳根德兰·托斯卡纳;康斯坦丁·施密特;斯特凡·拜尔;克里斯蒂安·诺伊坎;贝恩德·埃德勒;克里斯蒂安·黑尔姆里希 申请(专利权)人: 弗劳恩霍夫应用研究促进协会
主分类号: G10L21/0388 分类号: G10L21/0388;G10L19/008;G10L19/02
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 康建峰;杨华
地址: 德国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 提供了音频编码器、音频解码器及相关方法。一种用于生成解码的双声道信号的设备包括:音频处理器(802),用于对编码的双声道信号进行解码以获得第一组第一频谱部分;参数化解码器(804),用于提供第二组第二频谱部分的参数化数据以及提供用于标识第二频谱部分的第一双声道表示或不同的第二双声道表示的双声道标识;以及频率再生器(806),用于取决于第一组第一频谱部分中的第一频谱部分、第二部分的参数化数据以及第二部分的双声道标识来再生第二频谱部分。
搜索关键词: 音频 编码器 解码器 相关 方法
【主权项】:
1.一种用于生成解码的双声道信号的设备,包括:/n音频处理器(802),用于对编码的双声道信号进行解码以获得第一组第一频谱部分;/n参数化解码器(804),用于提供:第二组第二频谱部分的参数化数据以及用于标识第二频谱部分的第一双声道表示或不同的第二双声道表示的双声道标识;以及/n频率再生器(806),用于取决于第一组第一频谱部分中的第一频谱部分、第二频谱部分的参数化数据以及第二频谱部分的双声道标识来再生第二频谱部分。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910689687.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种野外声音收集方法、装置、计算机设备和存储介质-202310882548.2
  • 滕兵 - 百鸟数据科技(北京)有限责任公司
  • 2023-07-19 - 2023-10-27 - G10L21/0388
  • 本发明适用于声音信号处理技术领域,提供了一种野外声音收集方法、装置、计算机设备和存储介质,一种野外声音收集方法,通过采集宽频率范围内的声音信号,能够捕捉不同频率范围内的更丰富,更详细的声音信息,提高声音采集的质量和准确性;通过处理采集的声音信号,生成声音文件,保证采集的声音数据质量高,减少信息丢失,进而提高分析结果的可靠性;采用梯度降频信号处理算法对声音信号进行进一步处理,将声音信号处理成人可听频率范围的声音,使得用户可以更快地获取有价值的结果,提高研究效率,同时,可以提取声音信号中隐藏的关键特征,为环境保护,野生动物保育等领域的研究和实践提供更有价值的数据支持。
  • 高频带信号建模-202010353901.4
  • 文卡特什·克里希南;文卡特拉曼·S·阿提 - 高通股份有限公司
  • 2014-12-15 - 2023-09-19 - G10L21/0388
  • 本申请涉及高频带信号建模。本发明涉及一种方法,其包含在语音编码器处将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带。所述方法还包含基于所述第一组子频带产生经谐波扩展的信号。所述方法进一步包含至少部分地基于所述经谐波扩展的信号产生第三组子频带。所述第三组子频带对应于所述第二组子频带。所述方法还包含确定所述第三组子频带中的第一子频带的第一调节参数或所述第三组子频带中的第二子频带的第二调节参数。所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
  • 声音信号处理装置、声音信号处理方法以及记录介质-201780059386.5
  • 铃木良二 - 松下知识产权经营株式会社
  • 2017-09-22 - 2023-07-04 - G10L21/0388
  • 提供声音信号处理装置,能够针对因基于声音信号串的样本化等而丢失高频成分等而生成的输入信号数据,抑制失真以及噪声,进行丢失的成分的复原。声音信号处理装置具备:神经网络电路,包括具备多个输入单元的输入层、中间层、以及具备多个输出单元的输出层;输入部,将基于声音信号串经过样本化而生成的输入信号数据串中的多个连续的样本单位的各单位数据按每个单位时间一一对应地统一输入到多个输入单元,并进行每个单位时间的统一输入以使得在一个单位时间被输入到一个输入单元的单位数据在其他单位时间被输入到其他输入单元;以及输出部,将基于与跨越连续的多个单位时间的统一输入相应地从多个输出单元在多个单位时间的每个单位时间输出的数据的运算结果按每个单位时间进行输出。
  • 信号处理装置以及信号处理方法-201910370417.X
  • 宫阪修二 - 株式会社索思未来
  • 2019-05-06 - 2022-11-22 - G10L21/0388
  • 一种信号处理装置,根据声音的频率信号,决定第一基准频率以及带宽,输出第一系数列,该第一系数列取值为,针对所述频率信号中出现的多个谐波的信号列中的、与第一基准频率最近的信号列,取1以下的最大值,并且针对远离第一基准频率的信号列,越远离第一基准频率就越取小的值,针对在比第一基准频率低的低频带侧具有带宽W的频率信号的信号列,执行与第一系数列相乘的乘法处理,以及将第一基准频率作为对称轴,翻转到比第一基准频率高的高的频率区域,生成翻转信号列,通过将在比第一基准频率高的高频带侧具有带宽的频率信号的信号列,替换为翻转信号列,来输出补充后的频率信号。
  • 确定噪声混合因子的方法、系统、编码器、解码器和介质-201711320050.8
  • 罗宾·特辛;米夏埃尔·舒格 - 杜比国际公司
  • 2013-02-22 - 2022-09-27 - G10L21/0388
  • 确定噪声混合因子的方法、系统、编码器、解码器和介质。一种用于确定噪声混合因子的方法;其中噪声混合因子被用于基于音频信号的低频分量来近似音频信号的高频分量;其中高频分量包括高频带中的一个或更多个高频子带信号;其中低频分量包括低频带中的一个或更多个低频子带信号;其中近似高频分量包括:将一个或更多个低频子带信号复制到高频带,从而产生一个或更多个近似的高频子带信号;该方法包括:基于一个或更多个高频子带信号确定目标分频带音调值;基于一个或更多个近似的高频子带信号确定源分频带音调值;以及基于目标分频带音调值和源分频带音调值确定噪声混合因子。
  • 基于深度学习的语音频带扩展方法、装置及编码方法-202210636744.7
  • 李强;王尧;叶东翔;朱勇 - 北京百瑞互联技术有限公司
  • 2022-06-07 - 2022-09-09 - G10L21/0388
  • 本申请公开了一种基于深度学习的语音频带扩展方法、装置及编码方法,属于音频编码技术领域,该方法包括:对音频数据进行编码至低延迟改进型离散余弦变换后,得到音频数据对应的谱系数,并进行特征提取,得到具有元音和摩擦音信息的第一特征参数;对音频数据进行重采样和长期后置滤波器处理,并对处理的结果进行特征提取,得到具有元音和摩擦音信息的第二特征参数;将第一特征参数和第二特征参数输入到预训练的神经网络模型中,生成音频数据对应的全带宽谱系数。本申请利用编码过程中的已有参数,并进行特征提取,获取音频数据中关于元音和摩擦音的特征,充分考虑原有音频数据中元音和摩擦音的不同,进行更加准确的频带扩展,提升用户体验。
  • 一种基于稀疏网络模型的声场球谐函数信号频域扩展方法-202210231178.1
  • 曲天书;吴玺宏;高山 - 南京未来脑科技有限公司;北京大学
  • 2022-03-10 - 2022-08-09 - G10L21/0388
  • 本发明公开了一种基于稀疏网络模型的声场球谐函数信号频域扩展方法。本方法为:使用全频带卷积层从多通道麦克风信号x中提取声场球谐函数变换过程中的频域无关特征;采用稀疏网络模型将频域无关特征分解为多个分频带特征,将每一分频带特征输入一分频带卷积网络来提取该分频带特征所对应的频率变换特征,并将其输入到频点内全连接层;模型包括多个并列的分频带卷积网络,每一所述分频带卷积网络包括依次连接的多个卷积层,且中间的两卷积层之间设有两稀疏卷积层;频点内全连接层根据各分频带特征对应的频率变换特征提取不同频点之间的球谐函数变换差异特征;对所述球谐函数变换差异特征进行频域空间逆傅里叶变换,得到对应的声场球谐函数信号。
  • 恢复音频信号的方法和装置-201811053050.0
  • 刘佳泽;王宇飞 - 广州酷狗计算机科技有限公司
  • 2018-09-10 - 2021-10-08 - G10L21/0388
  • 本申请提供了一种恢复音频信号的方法和装置,属于音频技术领域。所述方法包括:每次缓存预设数目个采样点采样的音频信号后,通过FFT对采样得到的音频信号进行频谱分析,确定出音频信号被压缩时,滤去的频率点,然后基于该频率点之前的音频信号进行高频信号的恢复,然后再进行高频信号的相位的恢复。采用本申请,提供了一种恢复音频信号的方法。
  • 编码装置和方法、解码装置和方法以及程序-201580041640.X
  • 锦织修一郎;铃木志朗 - 索尼公司
  • 2015-07-23 - 2021-03-16 - G10L21/0388
  • 本专利涉及即使在具有小的资源的环境下也使得能够获得高质量的声音的编码装置和方法、解码装置和方法以及程序。分解单元对所提供的代码串进行分解以获得经量化的低频频谱、频谱特性代码以及经量化的扩展系数。在这种情况下,针对每个高频频段的经量化的扩展系数或单个经量化的扩展系数根据频谱特性代码而被包括在代码串中。频谱逆量化单元对经量化的低频频谱进行逆量化以获得低频频谱,并且扩展系数逆量化单元对经量化的扩展系数进行逆量化以获得扩展系数。扩展频谱生成单元基于与频谱特性代码对应的扩展系数和低频频谱来生成扩展频谱。IMDCT单元根据低频频谱和扩展频谱生成频段扩展的时间序列信号。本专利可应用于解码装置。
  • 一种基于低码率的音频通信带宽扩展系统及其扩展方法-202010996322.1
  • 卞林波;吴兰芬 - 南京市晨枭软件技术有限公司
  • 2020-09-21 - 2021-02-09 - G10L21/0388
  • 本发明公开了一种基于低码率的音频通信带宽扩展系统及其扩展方法,包括:低频滤波电路、高频滤波电路、低频激励电路、信号抑制电路,所述低频滤波电路通过设定信号导通临界值,完成高频信号的阻隔、减弱,从而让低频信号通过;所述高频滤波电路将频率以上信号分量通过,而对频率以下的信号进行分量抑制,完成高频信号的通过;所述低频激励电路对低频信号进行管理完成信号源向电路输入的电压来推动电路的平稳运行;所述信号抑制电路通过限制音频通信信号跳动,完成输入信号到输出信号的平稳转换;本发明通过对音频通信信号的处理以及带宽的扩张,提高音频通信信号的传输效果,在输出信号后再次调整信号,消除干扰信号的融入。
  • 高频音频重建技术的集成-201980034785.5
  • K·克乔埃尔林;L·维尔蒙斯;H·普尔纳根;P·埃克斯特兰德 - 杜比国际公司
  • 2019-04-25 - 2021-01-05 - G10L21/0388
  • 本发明揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低频带音频信号滤波以产生经滤波低频带音频信号。所述方法还包含提取指示是对所述音频数据执行频谱平移还是谐波转置的标记且根据所述标记使用所述经滤波低频带音频信号及所述高频重建元数据来再生所述音频信号的高频带部分。将所述高频再生执行为每个音频频道具有3010个样本的延迟的后处理操作。
  • 一种语音压缩、解压缩方法、装置和电子设备-201911260327.1
  • 文仕学 - 北京搜狗科技发展有限公司
  • 2019-12-10 - 2020-03-31 - G10L21/0388
  • 本发明实施例提供了一种语音压缩、解压缩方法、装置和电子设备,其中,所述语音压缩方法包括:获取原始语音数据;依据编码神经网络对所述原始语音数据进行频域压缩和/或时域压缩,得到压缩语音数据;由于采用训练数据即可以训练神经网络学习到丢弃语音数据中哪些频率分量,而无需运用声学领域知识,进而本发明实施例设计用于语音数据压缩的编码器难度更小,从而能够实现设计难度小的编码器进行语音数据的压缩。
  • 产生频率增强音频信号的译码器和产生编码信号的编码器-201811139723.4
  • 弗雷德里克·纳格尔;萨沙·迪施;安德烈娅斯·尼德迈尔 - 弗劳恩霍夫应用研究促进协会
  • 2014-01-28 - 2019-03-22 - G10L21/0388
  • 一种用于生成频率增强音频信号(120)的译码器和方法以及用于生成编码信号的编码器和方法。所述译码器包括:特征提取器(104),用于自核心信号(100)提取特征;边信息提取器(110),用于提取与该核心信号相关联的选择边信息;参数生成器(108),用于产生用于估计未由所述核心信号(100)限定的所述频率增强音频信号(120)的频谱范围的参数表示,其中所述参数生成器(108)被配置成响应于所述特征(112)提供数个参数表示替代例(702,704,706,708),且其中所述参数生成器(108)被配置成响应于所述选择边信息(712‑718)选择所述参数表示替代例中的一者作为所述参数表示;以及信号估计器(118),用于使用选择的所述参数表示来估计所述频率增强音频信号(120)。
  • 产生频率增强音频信号的译码器和产生编码信号的编码器-201811139722.X
  • 弗雷德里克·纳格尔;萨沙·迪施;安德烈娅斯·尼德迈尔 - 弗劳恩霍夫应用研究促进协会
  • 2014-01-28 - 2019-02-15 - G10L21/0388
  • 一种用于生成频率增强音频信号(120)的译码器和方法以及用于生成编码信号的编码器和方法。所述译码器包括:特征提取器(104),用于自核心信号(100)提取特征;边信息提取器(110),用于提取与该核心信号相关联的选择边信息;参数生成器(108),用于产生用于估计未由所述核心信号(100)限定的所述频率增强音频信号(120)的频谱范围的参数表示,其中所述参数生成器(108)被配置成响应于所述特征(112)提供数个参数表示替代例(702,704,706,708),且其中所述参数生成器(108)被配置成响应于所述选择边信息(712‑718)选择所述参数表示替代例中的一者作为所述参数表示;以及信号估计器(118),用于使用选择的所述参数表示来估计所述频率增强音频信号(120)。
  • 语音解码装置、语音编码装置、语音解码方法以及语音编码方法-201510324219.1
  • 菊入圭;山口贵史 - 株式会社NTT都科摩
  • 2012-02-16 - 2018-11-06 - G10L21/0388
  • 本发明提供语音解码装置、语音编码装置、语音解码方法以及语音编码方法。语音解码装置(1)具有:解复用部(1a)、低频带解码部(1b)、频带分割滤波器组部(1c)、编码序列解析部(1d)、编码序列解码/逆量化部(1e)、高频带生成部(1h)、取得多个低频带的时间包络的低频带时间包络计算部(1f1~1fn)、使用时间包络信息以及多个低频带时间包络来计算高频带时间包络的时间包络计算部(1g)、使用时间包络计算部(1g)取得的时间包络调整高频带成分的时间包络的时间包络调整部(1i)和频带合成滤波器组部(1j)。
  • 终端及其优化语音命令的方法、存储装置-201711038813.X
  • 陈琼 - 捷开通讯(深圳)有限公司
  • 2017-10-30 - 2018-04-06 - G10L21/0388
  • 本发明公开一种终端及其优化语音命令的方法、存储装置。所述方法包括接收或者从当前环境中采集音频信号;解析音频信号并获取所述音频信号的文件头信息;根据所述文件头信息选取音频处理算法;通过选取的音频处理算法对音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。基于此,本发明能够在确保语音命令识别率的同时降低硬件要求,成本低且通用性强。
  • 时域中的虚拟低音的相加-201610398957.5
  • 游余立 - 国光电器股份有限公司
  • 2016-06-07 - 2017-05-10 - G10L21/0388
  • 公开了时域中的虚拟低音的相加。提供了用于对音频信号进行处理以添加虚拟低音的系统、方法和技术。在一个代表性实施例中,一种设备包括(a)输入线,输入时域中的原始音频信号;(b)低音提取滤波器,提取原始音频信号的低音部分,该低音部分也在时域中;(c)估计器,估计低音部分内的低音声音的基频;(d)频移器,将低音部分偏移作为估计器估计的基频的整数倍的正频率增量,从而提供虚拟低音信号;(e)加法器,具有(i)耦合到原始音频信号和虚拟低音信号的输入和(ii)输出;以及(f)音频输出装置,耦合到加法器的输出。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top