[发明专利]音频信号解码器、音频信号编码器、用以将音频信号解码的方法、用以将音频信号编码的方法、及使用编码上下文的音高相依适应技术的计算机程序有效

申请号：	201180021269.2	申请日：	2011-03-09
公开（公告）号：	CN102884572A	公开（公告）日：	2013-01-16
发明（设计）人：	斯特凡·拜尔;汤姆·贝克斯特伦;拉尔夫·盖尔;贝恩德·埃德勒;萨沙·迪施;拉尔斯·维莱蒙斯	申请（专利权）人：	弗兰霍菲尔运输应用研究公司;杜比AB国际公司
主分类号：	G10L19/022	分类号：	G10L19/022
代理公司：	北京康信知识产权代理有限责任公司 11240	代理人：	余刚;吴孟秋
地址：	德国***	国省代码：	德国;DE
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于包含一编码频谱表示（ac_spectral_data[]）和一编码时间扭曲信息（tw_data[]）的编码音频信号表示（152）提供一解码音频信号表示（154）的音频信号解码器（150），该音频信号解码器包含一基于上下文的频谱值解码器（160），配置成依赖一上下文状态解码一描述一或更多频谱值、或一或更多频谱值的一数字表示的至少一部分（m）的码字（acod_m）以获得解码频谱值（162，297，x_ac_dec[]）。音频信号解码器也包含一配置成依赖一或更多先前解码频谱值（162，297）决定一现行上下文状态（164，c）的上下文状态决定器（170）。音频信号解码器也包含一时间扭曲频域对时域转换器（180），配置成基于一组与该特定音帧关联且由该基于上下文的频谱值解码器提供的解码频谱值（162）、并依赖时间扭曲信息而提供一特定音帧的时间扭曲时域表示（182）。上下文状态决定器（170）配置成使上下文状态的决定适应后续音帧之间的一基本频率改变。一音频信号编码器应用一类似的概念。
搜索关键词：	音频信号解码器编码器用以解码方法编码使用上下文音高相依适应技术计算机
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种音频信号解码器（150，240），用于根据包含一编码频谱表示（ac_spectral_data[]）及一编码时间扭曲信息（tw_data[]）的一编码音频信号表示（152）提供一解码音频信号表示（154），该音频信号解码器包含：一基于上下文的频谱值解码器（160），其配置成依赖一上下文状态解码一描述一或更多频谱值或一或更多频谱值的一数字表示的至少一部分（m）的码字（acod_m），以便获得解码频谱值（162，297，x_ac_dec[]）；一上下文状态决定器（170，400），配置成依赖一或更多先前解码频谱值（162，297）决定一现行上下文状态（164，c）；一时间扭曲频域对时域转换器（180），配置成根据一组与特定音帧相关联且由基于上下文的频谱值解码器所提供的解码频谱值（162，297）并依赖该时间扭曲信息提供一特定音帧的时间扭曲时域表示（182）；其中该上下文状态决定器（170，400）配置成使该上下文状态的决定适应后续音帧之间的一基本频率改变。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司;杜比AB国际公司，未经弗兰霍菲尔运输应用研究公司;杜比AB国际公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201180021269.2/，转载请声明来源钻瓜专利网。

上一篇：基于CMOS工艺实现的高精度片上时钟振荡器
下一篇：在神经听觉假体中产生电极刺激信号的方法和装置

同类专利

使用音频对象的时间变化的音频对象聚类-201410078314.3
发明人：陈连武;芦烈;J·布里巴特 -专利权人：杜比实验室特许公司
申请日： 2014-02-28 - 公布日： 2019-10-29 - 主分类号： G10L19/022
摘要：本发明的实施例涉及使用音频对象的时间变化的音频对象聚类。提供一种用于在音频对象聚类中使用音频对象的时间变化的方法。该方法包括：获取与所述音频对象相关联的音轨的至少一个片段，所述至少一个片段包含所述音频对象；基于所述音频对象的至少一个属性，估计所述音频对象在所述至少一个片段的持续时间上的变化；以及至少部分地基于估计的所述变化，调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。还公开了相应的系统和计算机程序产品。

音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置-201380041457.0
发明人：文韩吉;金贤郁;李男淑;吴殷美 -专利权人：三星电子株式会社
申请日： 2013-06-04 - 公布日： 2018-07-31 - 主分类号： G10L19/022
摘要：一种对音频信号进行编码的方法，包括：产生时域的修正信号使得以帧为单位补偿频率分辨率；通过使用被设计为具有小于50％的重叠区间的窗类型来对时域的修正信号进行分析加窗；通过对时域的经分析加窗的信号进行变换来产生频域的变换系数。一种对音频信号进行解码的方法，包括：通过针对从比特流解码的频域信号以子频带为单位分解频率槽，来恢复频率分辨率；将频域的恢复了分辨率的信号逆变换为时域信号；通过使用被设计为具有小于50％的重叠区间的窗类型，来对时域信号进行合成加窗。

一种音频信息获取的方法及其装置-201510172408.1
发明人：陈延 -专利权人：广东欧珀移动通信有限公司
申请日： 2015-04-10 - 公布日： 2018-07-06 - 主分类号： G10L19/022
摘要：本发明实施例公开了一种音频信息获取的方法及其装置。其中的方法包括：当接收到音频采样信号时，获取所述音频采样信号的采样率；根据所述音频采样信号的采样率获取最大采样点个数；采用所述最大采样点个数获得所述音频采样信号的采样位数。本发明实施例还相应地公开了一种音频信息获取的装置。采用本发明，可以实现准确获取音频采样信号的采样位数，提升对音频信息采样的准确度。

音频信号的比特分配的方法和装置-201210243316.4
发明人：齐峰岩;苗磊;刘泽新 -专利权人：华为技术有限公司
申请日： 2012-07-13 - 公布日： 2017-04-12 - 主分类号： G10L19/022
摘要：本发明实施例提供了一种音频信号的比特分配的方法和装置。其中，音频信号的比特分配的方法包括将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；将该多个子带划分为多个组，获取每个组的组参数，其中该组参数用于表征对应组的音频信号的信号特点和能量属性；根据每个组的组参数，为至少一个组分配编码比特，其中该至少一个组分配的编码比特数之和为该音频信号的编码比特数；依据至少一个组中的每个组的每个子带的子带归一化因子，将分配到该至少一个组的编码比特分配到该至少一个组中的每个组的每个子带。本发明实施例可以在中低比特率时，通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响。

一种音频信号的时域包络处理方法及装置、编码器-201410260730.5
发明人：刘泽新;苗磊 -专利权人：华为技术有限公司
申请日： 2014-06-12 - 公布日： 2016-02-17 - 主分类号： G10L19/022
摘要：本发明实施例提供一种音频信号的时域包络处理方法及装置、编码器。该方法包括：根据接收到的当前帧音频信号，得到所述当前帧音频信号的高带信号；根据预先确定的时域包络个数M将所述当前帧音频信号的高带信号分成M个子帧，其中，M为大于等于2的整数；计算每一个所述子帧的时域包络；采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗；对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。本发明实施例提供的音频信号的时域包络处理方法及装置，在求解多个时域包络能够很好的保持信号能量的连续，同时降低了计算时域包络的复杂度。

基于分层事件检测和上下文模型的多源场景声音摘要方法-201410391254.0
发明人：路通;翁炀冰;王公友 -专利权人：南京大学
申请日： 2014-08-08 - 公布日： 2014-11-26 - 主分类号： G10L19/022
摘要：本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法，包括以下步骤：步骤一，输入一段待摘要的目标多源场景音频分割片段；步骤二，基于背景声音对音频场景片段进行分割；步骤三，通过一个谱聚类算法，将目标音频中相似的分割片段聚类起来，利用仿射函数检测背景声音事件，并计算声音事件的评分函数得到关键声音事件；步骤四，通过一个上下文模型计算声音事件之间的相关函数；步骤五，根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。

用于变换编码或解码的分析或合成加权窗口的自适应-201280034844.7
发明人： J·福尔;P·菲利浦 -专利权人：奥林奇公司
申请日： 2012-07-09 - 公布日： 2014-05-21 - 主分类号： G10L19/022
摘要：本发明涉及一种使用应用于样本帧的分析(h_s)或合成(h_a)加权窗口的数字音频信号的变换编码或解码的方法。所述方法包括对为具有给定初始大小N的变换提供的初始窗口进行不规则采样(E10)，以应用具有大小为M的第二变换，M不同于N。本发明还涉及适用于实现上述方法的设备。

一种自适应的变采样率音频采样方法-201310562870.3
发明人：肖唐良;刘娜;杨青;宫夏 -专利权人：中国电子科技集团公司第四十一研究所
申请日： 2013-11-07 - 公布日： 2014-04-23 - 主分类号： G10L19/022
摘要：本发明提供一种自适应的变采样率音频采样方法，其根据采样数据测量过零点数目，依据过零点数目调整采样频率，具体包括以下步骤：步骤1，通过采样点的电压值估计过零点的时刻：判断前后2个采样值的符号是否相同，若相同，则两个采样值的两个采样点间没有过零点发生；若不同，则两个采样值的两个采样点的电压穿过零点一次，两个采样点的电压符号发生一次变更；步骤2，统计一帧采样数据内变更的次数得出过零点的数目，具体而言，以采样数据的符号位为计数时钟，利用符号位的上升沿和下降沿，在一帧采样数据传输时间内进行计数，得到计数值就是这帧数据的过零点数目；步骤3，根据过零点数目与频率的对应关系，利用分段采样进行采样频率的选择。

使用时间分辨率能选择的低复杂性频谱分析/合成-201310553487.1
发明人： A.塔莱布 -专利权人：爱立信电话股份有限公司
申请日： 2008-08-25 - 公布日： 2014-02-19 - 主分类号： G10L19/022
摘要：信号处理是基于这样的构思：将时域混叠(12，TDA)帧用作时间分段(14)和频谱分析(16)的基础，基于时域混叠帧来在时间上执行分段并且基于所得到的时间段来执行频谱分析。因此可以通过基于应用哪个频谱分析而简单地适配时间分段以获得合适数目的时间段，从而改变整体“分段的”时间到频率的变换的时间分辨率。为所有段获得的整个频谱系数集提供原始信号帧的能选择的时间-频率平铺。

一种基于软件实现的音乐内容截幅检测方法-201210578700.X
发明人：梅林海;刘丹;路雪玲;史峰;张磊;聂小林;江涛 -专利权人：安徽科大讯飞信息科技股份有限公司
申请日： 2012-12-27 - 公布日： 2013-05-22 - 主分类号： G10L19/022
摘要：本发明涉及一种基于软件实现的音乐内容截幅检测方法，用于实现对运营商提供的音乐内容的质量检测，具体为：解析现有的音频文件，将音频文件转化成单通道；对音频数据进行加窗，通常直接使用矩形窗；统计加载的音频信号中超过某一个特定幅度值Fδ的采样点的个数,使用变量sum对个数进行累加统计；计算sum与步骤二中的矩形窗的窗宽M，求出它们的比值ξ，将ξ与选定的阈值α进行比较，判断音频文件是否存在截幅；通过不断的重复加窗、统计频率、计算比值并与阈值比较，最终完成整个音频文件的检测。本发明能够实现快速检测音频截幅问题，检测过程中不需要人工参与，节约人力、提高审核效率，且降低审核出错几率。

音频编码装置和方法、音频解码装置和方法以及程序-201210350062.6
发明人：铃木志朗;松村祐树;户栗康裕;前田祐儿;松本淳 -专利权人：索尼公司
申请日： 2012-09-19 - 公布日： 2013-04-03 - 主分类号： G10L19/022
摘要：本发明提供了音频编码装置和音频编码方法、音频解码装置和音频解码方法、以及程序，其中该音频编码装置包括：第一加窗部，将音频信号与第一窗函数相乘；第二加窗部，将音频信号与第二窗函数相乘，第二窗函数的特征不同于第一窗函数的特征；窗选择部，基于经第一加窗部相乘后的音频信号和经第二加窗部相乘后的音频信号，选择第一窗函数或第二窗函数作为最佳窗函数；编码部，对与最佳窗函数相乘后的音频信号的频谱进行编码；以及传送部，传送经编码部编码后的频谱和表示最佳窗函数的窗函数信息。

信号处理器以及用于处理信号的方法-201180023295.9
发明人：克里斯蒂安·赫尔姆里希;拉尔夫·盖尔 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2011-03-08 - 公布日： 2013-01-23 - 主分类号： G10L19/022
摘要：一种信号处理器，用于根据输入信号提供输入信号的处理版本，该信号处理器包括：窗口化器，被配置为根据用于多个窗口值指数值的信号处理窗口值所描述的信号处理窗口，将输入信号的一部分或其预处理版本窗口化，以获得输入信号的处理版本。该信号处理器还包括窗口提供器，用于根据一个或多个窗口形状参数，提供用于多个窗口值指数值的信号处理窗口值。

使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器、方法及计算机程序-201180023298.2
发明人：斯特凡·拜尔;汤姆·贝克斯特伦;拉尔夫·盖尔;贝恩德·埃德勒;萨沙·迪施;拉尔斯·维莱蒙斯 -专利权人：弗兰霍菲尔运输应用研究公司;杜比AB国际公司
申请日： 2011-03-09 - 公布日： 2013-01-16 - 主分类号： G10L19/022
摘要：一种经组配来基于包含取样频率信息的编码音频信号表示形态、编码时间扭曲信息及编码频谱表示形态而提供一解码音频信号表示形态的音频信号解码器，其包含一时间扭曲计算器及一扭曲解码器。该时间扭曲计算器经组配来依据该取样频率信息而调适一映射规则用以将编码时间扭曲信息的码字组映射至描述该解码时间扭曲信息的解码时间扭曲值。扭曲解码器经组配来基于编码频谱表示形态及依据该解码时间扭曲信息而提供该解码音频信号表示形态。

音频信号解码器、音频信号编码器、用以将音频信号解码的方法、用以将音频信号编码的方法、及使用编码上下文的音高相依适应技术的计算机程序-201180021269.2
发明人：斯特凡·拜尔;汤姆·贝克斯特伦;拉尔夫·盖尔;贝恩德·埃德勒;萨沙·迪施;拉尔斯·维莱蒙斯 -专利权人：弗兰霍菲尔运输应用研究公司;杜比AB国际公司
申请日： 2011-03-09 - 公布日： 2013-01-16 - 主分类号： G10L19/022
摘要：一种基于包含一编码频谱表示（ac_spectral_data[]）和一编码时间扭曲信息（tw_data[]）的编码音频信号表示（152）提供一解码音频信号表示（154）的音频信号解码器（150），该音频信号解码器包含一基于上下文的频谱值解码器（160），配置成依赖一上下文状态解码一描述一或更多频谱值、或一或更多频谱值的一数字表示的至少一部分（m）的码字（acod_m）以获得解码频谱值（162，297，x_ac_dec[]）。音频信号解码器也包含一配置成依赖一或更多先前解码频谱值（162，297）决定一现行上下文状态（164，c）的上下文状态决定器（170）。音频信号解码器也包含一时间扭曲频域对时域转换器（180），配置成基于一组与该特定音帧关联且由该基于上下文的频谱值解码器提供的解码频谱值（162）、并依赖时间扭曲信息而提供一特定音帧的时间扭曲时域表示（182）。上下文状态决定器（170）配置成使上下文状态的决定适应后续音帧之间的一基本频率改变。一音频信号编码器应用一类似的概念。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频信号解码器、音频信号编码器、用以将音频信号解码的方法、用以将音频信号编码的方法、及使用编码上下文的音高相依适应技术的计算机程序有效

专利文献下载