[发明专利]音频信号解码器、音频信号编码器、用以将音频信号解码的方法、用以将音频信号编码的方法、及使用编码上下文的音高相依适应技术的计算机程序有效

专利信息
申请号: 201180021269.2 申请日: 2011-03-09
公开(公告)号: CN102884572A 公开(公告)日: 2013-01-16
发明(设计)人: 斯特凡·拜尔;汤姆·贝克斯特伦;拉尔夫·盖尔;贝恩德·埃德勒;萨沙·迪施;拉尔斯·维莱蒙斯 申请(专利权)人: 弗兰霍菲尔运输应用研究公司;杜比AB国际公司
主分类号: G10L19/022 分类号: G10L19/022
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 余刚;吴孟秋
地址: 德国*** 国省代码: 德国;DE
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于包含一编码频谱表示(ac_spectral_data[])和一编码时间扭曲信息(tw_data[])的编码音频信号表示(152)提供一解码音频信号表示(154)的音频信号解码器(150),该音频信号解码器包含一基于上下文的频谱值解码器(160),配置成依赖一上下文状态解码一描述一或更多频谱值、或一或更多频谱值的一数字表示的至少一部分(m)的码字(acod_m)以获得解码频谱值(162,297,x_ac_dec[])。音频信号解码器也包含一配置成依赖一或更多先前解码频谱值(162,297)决定一现行上下文状态(164,c)的上下文状态决定器(170)。音频信号解码器也包含一时间扭曲频域对时域转换器(180),配置成基于一组与该特定音帧关联且由该基于上下文的频谱值解码器提供的解码频谱值(162)、并依赖时间扭曲信息而提供一特定音帧的时间扭曲时域表示(182)。上下文状态决定器(170)配置成使上下文状态的决定适应后续音帧之间的一基本频率改变。一音频信号编码器应用一类似的概念。
搜索关键词: 音频 信号 解码器 编码器 用以 解码 方法 编码 使用 上下文 音高 相依 适应 技术 计算机
【主权项】:
一种音频信号解码器(150,240),用于根据包含一编码频谱表示(ac_spectral_data[])及一编码时间扭曲信息(tw_data[])的一编码音频信号表示(152)提供一解码音频信号表示(154),该音频信号解码器包含:一基于上下文的频谱值解码器(160),其配置成依赖一上下文状态解码一描述一或更多频谱值或一或更多频谱值的一数字表示的至少一部分(m)的码字(acod_m),以便获得解码频谱值(162,297,x_ac_dec[]);一上下文状态决定器(170,400),配置成依赖一或更多先前解码频谱值(162,297)决定一现行上下文状态(164,c);一时间扭曲频域对时域转换器(180),配置成根据一组与特定音帧相关联且由基于上下文的频谱值解码器所提供的解码频谱值(162,297)并依赖该时间扭曲信息提供一特定音帧的时间扭曲时域表示(182);其中该上下文状态决定器(170,400)配置成使该上下文状态的决定适应后续音帧之间的一基本频率改变。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司;杜比AB国际公司,未经弗兰霍菲尔运输应用研究公司;杜比AB国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201180021269.2/,转载请声明来源钻瓜专利网。

同类专利
  • 使用音频对象的时间变化的音频对象聚类-201410078314.3
  • 陈连武;芦烈;J·布里巴特 - 杜比实验室特许公司
  • 2014-02-28 - 2019-10-29 - G10L19/022
  • 本发明的实施例涉及使用音频对象的时间变化的音频对象聚类。提供一种用于在音频对象聚类中使用音频对象的时间变化的方法。该方法包括:获取与所述音频对象相关联的音轨的至少一个片段,所述至少一个片段包含所述音频对象;基于所述音频对象的至少一个属性,估计所述音频对象在所述至少一个片段的持续时间上的变化;以及至少部分地基于估计的所述变化,调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。还公开了相应的系统和计算机程序产品。
  • 一种音频信息获取的方法及其装置-201510172408.1
  • 陈延 - 广东欧珀移动通信有限公司
  • 2015-04-10 - 2018-07-06 - G10L19/022
  • 本发明实施例公开了一种音频信息获取的方法及其装置。其中的方法包括:当接收到音频采样信号时,获取所述音频采样信号的采样率;根据所述音频采样信号的采样率获取最大采样点个数;采用所述最大采样点个数获得所述音频采样信号的采样位数。本发明实施例还相应地公开了一种音频信息获取的装置。采用本发明,可以实现准确获取音频采样信号的采样位数,提升对音频信息采样的准确度。
  • 音频信号的比特分配的方法和装置-201210243316.4
  • 齐峰岩;苗磊;刘泽新 - 华为技术有限公司
  • 2012-07-13 - 2017-04-12 - G10L19/022
  • 本发明实施例提供了一种音频信号的比特分配的方法和装置。其中,音频信号的比特分配的方法包括将音频信号的频带分为多个子带,量化每个子带的子带归一化因子;将该多个子带划分为多个组,获取每个组的组参数,其中该组参数用于表征对应组的音频信号的信号特点和能量属性;根据每个组的组参数,为至少一个组分配编码比特,其中该至少一个组分配的编码比特数之和为该音频信号的编码比特数;依据至少一个组中的每个组的每个子带的子带归一化因子,将分配到该至少一个组的编码比特分配到该至少一个组中的每个组的每个子带。本发明实施例可以在中低比特率时,通过分组保证前后帧分配比较稳定,减少全局对局部不连续的影响。
  • 一种音频信号的时域包络处理方法及装置、编码器-201410260730.5
  • 刘泽新;苗磊 - 华为技术有限公司
  • 2014-06-12 - 2016-02-17 - G10L19/022
  • 本发明实施例提供一种音频信号的时域包络处理方法及装置、编码器。该方法包括:根据接收到的当前帧音频信号,得到所述当前帧音频信号的高带信号;根据预先确定的时域包络个数M将所述当前帧音频信号的高带信号分成M个子帧,其中,M为大于等于2的整数;计算每一个所述子帧的时域包络;采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。本发明实施例提供的音频信号的时域包络处理方法及装置,在求解多个时域包络能够很好的保持信号能量的连续,同时降低了计算时域包络的复杂度。
  • 基于分层事件检测和上下文模型的多源场景声音摘要方法-201410391254.0
  • 路通;翁炀冰;王公友 - 南京大学
  • 2014-08-08 - 2014-11-26 - G10L19/022
  • 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。
  • 一种自适应的变采样率音频采样方法-201310562870.3
  • 肖唐良;刘娜;杨青;宫夏 - 中国电子科技集团公司第四十一研究所
  • 2013-11-07 - 2014-04-23 - G10L19/022
  • 本发明提供一种自适应的变采样率音频采样方法,其根据采样数据测量过零点数目,依据过零点数目调整采样频率,具体包括以下步骤:步骤1,通过采样点的电压值估计过零点的时刻:判断前后2个采样值的符号是否相同,若相同,则两个采样值的两个采样点间没有过零点发生;若不同,则两个采样值的两个采样点的电压穿过零点一次,两个采样点的电压符号发生一次变更;步骤2,统计一帧采样数据内变更的次数得出过零点的数目,具体而言,以采样数据的符号位为计数时钟,利用符号位的上升沿和下降沿,在一帧采样数据传输时间内进行计数,得到计数值就是这帧数据的过零点数目;步骤3,根据过零点数目与频率的对应关系,利用分段采样进行采样频率的选择。
  • 使用时间分辨率能选择的低复杂性频谱分析/合成-201310553487.1
  • A.塔莱布 - 爱立信电话股份有限公司
  • 2008-08-25 - 2014-02-19 - G10L19/022
  • 信号处理是基于这样的构思:将时域混叠(12,TDA)帧用作时间分段(14)和频谱分析(16)的基础,基于时域混叠帧来在时间上执行分段并且基于所得到的时间段来执行频谱分析。因此可以通过基于应用哪个频谱分析而简单地适配时间分段以获得合适数目的时间段,从而改变整体“分段的”时间到频率的变换的时间分辨率。为所有段获得的整个频谱系数集提供原始信号帧的能选择的时间-频率平铺。
  • 一种基于软件实现的音乐内容截幅检测方法-201210578700.X
  • 梅林海;刘丹;路雪玲;史峰;张磊;聂小林;江涛 - 安徽科大讯飞信息科技股份有限公司
  • 2012-12-27 - 2013-05-22 - G10L19/022
  • 本发明涉及一种基于软件实现的音乐内容截幅检测方法,用于实现对运营商提供的音乐内容的质量检测,具体为:解析现有的音频文件,将音频文件转化成单通道;对音频数据进行加窗,通常直接使用矩形窗;统计加载的音频信号中超过某一个特定幅度值Fδ的采样点的个数,使用变量sum对个数进行累加统计;计算sum与步骤二中的矩形窗的窗宽M,求出它们的比值ξ,将ξ与选定的阈值α进行比较,判断音频文件是否存在截幅;通过不断的重复加窗、统计频率、计算比值并与阈值比较,最终完成整个音频文件的检测。本发明能够实现快速检测音频截幅问题,检测过程中不需要人工参与,节约人力、提高审核效率,且降低审核出错几率。
  • 音频编码装置和方法、音频解码装置和方法以及程序-201210350062.6
  • 铃木志朗;松村祐树;户栗康裕;前田祐儿;松本淳 - 索尼公司
  • 2012-09-19 - 2013-04-03 - G10L19/022
  • 本发明提供了音频编码装置和音频编码方法、音频解码装置和音频解码方法、以及程序,其中该音频编码装置包括:第一加窗部,将音频信号与第一窗函数相乘;第二加窗部,将音频信号与第二窗函数相乘,第二窗函数的特征不同于第一窗函数的特征;窗选择部,基于经第一加窗部相乘后的音频信号和经第二加窗部相乘后的音频信号,选择第一窗函数或第二窗函数作为最佳窗函数;编码部,对与最佳窗函数相乘后的音频信号的频谱进行编码;以及传送部,传送经编码部编码后的频谱和表示最佳窗函数的窗函数信息。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top