[发明专利]一种空间音频参数帧间预测编解码方法无效

专利信息
申请号: 200910062732.2 申请日: 2009-06-16
公开(公告)号: CN101582262A 公开(公告)日: 2009-11-18
发明(设计)人: 胡瑞敏;周成;杭波;王晓晨 申请(专利权)人: 武汉大学
主分类号: G10L19/04 分类号: G10L19/04
代理公司: 武汉天力专利事务所 代理人: 严 彦;冯卫平
地址: 43007*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了基于贝叶斯梯度模型的空间音频参数帧间预测技术方案。编码过程:对输入的多声道音频信号的帧信号分子带提取空间音频参数;根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空间音频参数对当前帧的空间音频参数作出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差;对当前帧的空间音频参数预测残差进行编码得到编码码流。解码过程:从编码码流中解码得到帧信号的空间音频参数预测残差;用之前重建得到的一帧或多帧空间音频参数及当前帧的空间音频参数预测残差,得到空间音频参数预测系数,然后重建得到当前帧的空间音频参数。本发明考虑了空间音频参数的时域相关性,可有效降低编码码率。
搜索关键词: 一种 空间 音频 参数 预测 解码 方法
【主权项】:
1.一种空间音频参数帧间预测编码方法,其特征在于:包含以下步骤,步骤1.1,对输入的多声道音频信号的帧信号分子带提取空间音频参数;步骤1.2,根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空间音频参数对当前帧的空间音频参数作出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差,具体实现过程如下,(1)设每帧信号分K个子带,第m帧的K个子带的空间音频参数记为Sm1,Sm2,…SmK,K≥2;设第m帧之前第M帧第K个子带的空间音频参数记为S(m-M)K,第m帧前M帧的所有子带的空间音频参数则为S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K,M≥1;设第m帧的第i个子带的空间音频参数帧间差值Dim,m+1=S(m+1)i-Smi,]]>设空间音频参数的取值范围为-f到f,则Dim,m+1可能的取值范围为-2f到2f,这4f+1个差值的概率分布为P{(Dim,m+1)j},j=1,2...4f+1;]]>(2)预测方式如下,设事件Bmij对应于第m帧的第i个子带的空间音频参数从-f到f一共2f+1种取值,则Bmij,j=1,2...2f+1互斥且构成一个完全事件,P(Bmij),j=1,2...2f+1为事件Bmij发生的概率,在无任何先验知识的情况下P(Bmij)的初始值为P(B1i1)=P(B1i2)...=P(B1i2f+1)=1/2f+1;]]>设定事件A为伴随事件Bmij,j=1,2...2f+1发生而出现,由第m帧各子带的空间音频参数取值得到第m+1帧各子带的空间音频参数取值可能,则由第i个子带m帧空间音频参数取值Smi得到第m+1帧各空间音频参数取值概率为P(A/Bmij)=P{(Dim,m+1)j-Smi+f},j=1,2...,f+1;]]>在已知事件Bmij的概率P(Bmij)和事件Bmij发生条件下事件A的概率P(A/Bmij)的情况下,运用贝叶斯定理得到在事件A发生条件下第m+1帧事件B(m+1)ij的发生概率为P(B(m+1)ij/A)=P(Bmij)P(A/Bmij)Σn=12f+1P(Bmin)P(A/Bmin),j=1,2...2f+1;]]>预测时初始化B(m-K)ij=12f+1,j=1,2...2f+1,]]>然后将第m帧之前M帧的所有子带的空间音频参数S(m-M)1,S(m-M)2,…S(m-M)K,S(m-M+1)1,S(m-M+1)2,…S(m-M+1)K,…S(m-1)1,S(m-1)2,…S(m-1)K依次代入P(A/Bqij)=P{(Diq,q+1)j-Sqi+f},j=1,2...2f+1,]]>P(B(q+1)ij/A)=P(Bqij)P(A/Bqij)Σn=12f+1P(Bqin)P(A/Bqin),j=1,2...2f+1]]>其中m-K≤q≤m-1;最终得到事件A发生条件下Bmij的发生概率P(Bmij/A),j=1,2...2f+1,以P(Bmij/A),j=1,2...2f+1最大的值作为对第m帧的第i个子带的空间音频参数预测系数设当前帧为第m帧,根据第m帧的第i子带的空间音频参数Smi和空间音频参数预测系数计算当前帧的第i子带的空间音频参数预测残差δmi=Smi-Smi^,]]>i取1~K;步骤1.3,对当前帧的空间音频参数预测残差进行编码得到编码码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200910062732.2/,转载请声明来源钻瓜专利网。

同类专利
  • 一种处理音频信号的方法和装置-201080042540.6
  • 吴贤午;姜泓求;李昌宪;宋政旭 - LG电子株式会社;延世大学工业学术合作社
  • 2010-07-27 - 2012-07-11 - G10L19/04
  • 公开了一种用于处理音频信号的装置及其方法。本发明包括:当将第二编译方案应用于当前帧时,通过音频处理装置接收窗口类型信息,所述窗口类型信息表示多个窗口当中的用于当前帧的特定窗口;并且根据窗口类型信息将当前窗口应用于当前帧,其中,当将第一编译方案应用于先前帧时,所述多个窗口是由短窗口、第一过渡窗口、第二过渡窗口组成的,其中,短窗口具有宽度是N/8的至少一个上升线,并且第一过渡窗口和第二过渡窗口具有宽度是N/4的上升线(其中N是帧长)。
  • 一种窄带码流转换为宽带码流的转换装置及其转换方法-201210014117.6
  • 陈喆;殷福亮;李文月 - 大连理工大学
  • 2012-01-17 - 2012-07-04 - G10L19/04
  • 本发明公开了一种窄带码流转换为宽带码流的转换装置及其转换方法,所述的装置包括扩展单元和训练单元,所述的扩展单元包括窄带码流分离单元、窄带码流解析单元、窄带能量计算单元、码书映射单元、函数映射单元、高频时域包络及频域包络编码单元、高频能量编码单元、码流合成单元以及高频能量解码单元。所述的方法包括以下步骤:窄带码流解析;码书映射;窄带能量计算;函数映射;编码和码流合成。本发明第一次实现了将G.729编码得到的窄带码流扩展成可以作为G.729.1解码器输入的宽带码流,可以直接将现有电话通信网络传来的窄带码流直接通过G.729.1解码输出得到宽带语音,实现了宽带终端对窄带终端的兼容。
  • 处理音频信号的方法和设备-201080041387.5
  • 吴贤午;李昌宪;姜泓求;宋政旭 - LG电子株式会社;延世大学工业学术合作社
  • 2010-09-17 - 2012-06-13 - G10L19/04
  • 本发明公开了一种用于处理音频信号的设备及其方法。本发明包括通过音频处理设备来接收包括以第一编译方案编码的当前帧和以第二编译方案编码的下一帧的音频信号;接收指示以矩形编译方案或非矩形编译方案编码当前帧的至少一个块的子编译标识信息;当子编译标识信息指示以非矩形编译方案编码当前帧的至少最后块时,根据用于下一帧的下一窗口是否是短窗口,来决定用于当前窗口的包括第一形状和第二形状的窗口形状;以及,将决定的窗口形状的当前窗口应用到当前帧,其中:第一形状具有带有第一坡度的下降线条,第二形状具有带有第二坡度的下降线条,并且,第一坡度比第二坡度更平缓。
  • 后向块自适应Golomb-Rice编解码方法及装置-201110263485.X
  • 杨新辉;刘任化 - 中科开元信息技术(北京)有限公司
  • 2011-09-07 - 2012-03-07 - G10L19/04
  • 本发明提出一种后向块自适应Golomb-Rice编解码方法,该方法利用自适应更新规则实现后向自适应Golomb-Rice编码;利用滑动窗口方法更新自适应参数;对Golomb-Rice参数m值采用分块更新,根据数据特性,自由选择分块大小,提高Golomb-Rice参数m值更新速度;对特征数据进行自适应m值的修正,实现无损音频编解码。本发明的编解码方法,具有运算复杂度低,存储空间占用小,可以实现对整数的压缩,特别对具有几何分布特性的数据实现高压缩率和高编解码速度,本发明方法很容易被应用到数字音频/视频领域,适用于在现代处理器上进行实现,大大降低了用户的处理器成本。
  • 基于AVS有损音频的无损编解码扩展方法-201010189598.5
  • 杨新辉;刘任化 - 中科开元信息技术(北京)有限公司
  • 2010-05-24 - 2011-11-30 - G10L19/04
  • 本发明涉及基于AVS有损音频的无损编解码扩展方法。一种基于AVS有损音频的无损编码扩展方法,该方法基于AVS音频标准进行分析,对AVS音频标准中的保留字进行重定义,扩展无损功能选项,并且通过复用AVS音频有损数据区域之后的填充区域,将无损音频数据存放于填充区域来实现有损无损信号的并存。因该方法改进技术具有简单,高效的特点,很容易被应用到数字音频领域,提供无损音频解码方案。
  • 预测残差信号的量化编码方法及装置-201010175717.1
  • 郎玥;吴文海;苗磊 - 华为技术有限公司
  • 2010-05-12 - 2011-11-16 - G10L19/04
  • 本发明公开了一种预测残差信号的量化编码方法及装置,其中的方法包括以下步骤:根据左右声道信号获取两路信号,并分别将两路信号变换到频域,采用频域的两路信号进行预测残差编码,得到预测残差信号;根据所述两路信号计算频域内的左右声道信号的特征参数;将所述特征参数与设定的阈值比较,根据比较结果选择不同的量化算法对预测残差信号进行量化编码。本发明实施例使得重建的立体声信号可以在声场的稳定性和增强的频谱范围之间做出比较好的折中,而获得较好的立体声重建质量。
  • 语音清晰度预测器及其应用-201110062950.3
  • C·H··塔阿尔;R·亨德里克斯;R·赫斯登斯;U·克耶姆斯;J·延森 - 奥迪康有限公司
  • 2011-03-11 - 2011-09-21 - G10L19/04
  • 本申请涉及一种提供语音清晰度预测器值的方法,该语音清晰度预测器值用于当目标语音信号经过算法处理和/或在噪声环境中接收时估算普通听音者理解所述目标语音信号的能力。本申请还涉及在噪声环境中改善听音者对目标语音信号的理解的方法以及对应的设备单元。本申请的目的是提供一种替代的客观清晰度测量方法,例如适于在时频环境中使用的测量方法。本发明可用于例如音频处理系统中、听音系统、助听器系统。
  • 一种线性预测分析方法、装置及系统-200980000109.2
  • 许剑峰;苗磊;齐峰岩;张德军;张清 - 华为技术有限公司
  • 2009-03-11 - 2011-05-18 - G10L19/04
  • 本发明公开了一种线性预测分析方法、装置及系统,涉及通信领域,能够提高线性预测编码的预测性能,并且分析运算复杂度低。解决方案为:获取输入信号至少一个样点的信号特性信息;对所述信号特性信息进行比较分析,得到分析结果;根据所述分析结果选择窗函数对所述输入信号进行自适应加窗,得到加窗后信号;对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。本发明用于线性预测编码。
  • 参数立体声编码方法、装置和参数立体声解码方法、装置-200810212339.2
  • 郎玥;吴文海;张清;苗磊 - 华为技术有限公司
  • 2008-09-08 - 2010-03-17 - G10L19/04
  • 本发明提供一种参数立体声编/解码方法及装置,属于语音编/解码技术领域。为解决现有参数立体声编码技术传输中预测误差能量较大和存在较强的周期性的问题而发明。所述编/解码方法及装置在互相关预测时不仅考虑信号的短时互相关性,而且考虑了信号的长时互相关性,去除了信号的长时互相关性,从而既降低了传输中预测误差的能量,去除了预测误差中存在的较强的周期性,又不至于像提高互相关预测滤波器的阶数那样造成复杂度的大幅度提升。并通过采用固定的预测滤波器的阶数,使得不同类型的信号性能得以统一。
  • 一种移动音源空间音频参数预测编解码方法及系统-200910272282.X
  • 胡瑞敏;周成;高丽;杭波;王晓晨 - 武汉大学
  • 2009-09-28 - 2010-03-17 - G10L19/04
  • 本发明涉及音频技术领域,尤其涉及一种移动音源空间音频参数预测编解码方法及系统。本发明提供的编码方法包括输入多声道音频信号,对输入的多声道音频信号提取空间音频参数,根据移动音源速度对当前帧的空间音频参数做出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差,对当前帧的空间音频参数预测残差进行编码得到编码码流,本发明提供的解码方法包括输入编码码流,从编码码流中解码得到空间音频参数预测残差,根据移动音源速度和当前帧空间音频参数预测残差重建当前帧空间音频参数。本发明根据多普勒效应、运动学原理、几何声学原理和波动声学原理来对移动音源空间参数变化作出准确估计,预测误差小,可有效降低编码码率。
  • 压缩编码和解码的方法、编码器和解码器以及编码装置-200910149824.4
  • 齐峰岩;苗磊;张清 - 华为技术有限公司
  • 2009-06-25 - 2009-12-23 - G10L19/04
  • 本发明实施例涉及压缩编码和解码的方法、编码器和解码器以及编码装置,其中压缩编码方法包括提取输入信号的符号信息得到输入信号的绝对值信号,采用预测系数获得所述绝对值信号的残差信号,所述预测系数根据所述输入信号的绝对值信号的信号特性进行预测分析获得,复用分别编码后的所述残差信号、所述符号信息以及编码参数,输出编码码流以提升语音频信号的压缩效率。
  • 基音增益获取方法、装置及编码器、解码器-200810247428.0
  • 张德军;苗磊;许剑峰;齐峰岩;张清;哈维·米希尔·塔迪;李立雄;马付伟 - 华为技术有限公司
  • 2008-12-31 - 2009-12-16 - G10L19/04
  • 本发明实施例涉及一种基音增益获取方法、装置及编码器、解码器,该方法包括:获取输入信号的信号信息;根据信号信息与基音增益的对应关系获取所述输入信号的信号信息对应的基音增益。本发明实施例利用预先获取的信号信息与基音增益的对应关系,根据信号信息能够获取到对应的基音增益,而且可以分别适用于编码端和解码端,使得编码端无需将基音增益传到解码端,解决了比特开销的难题。本发明实施例能够根据信号信息来自适应地确定基音增益,避免了消耗额外的比特去量化基音增益,没有影响到编码的性能,从而提高了压缩率。
  • 一种空间音频参数帧间预测编解码方法-200910062732.2
  • 胡瑞敏;周成;杭波;王晓晨 - 武汉大学
  • 2009-06-16 - 2009-11-18 - G10L19/04
  • 本发明提供了基于贝叶斯梯度模型的空间音频参数帧间预测技术方案。编码过程:对输入的多声道音频信号的帧信号分子带提取空间音频参数;根据空间音频参数帧间差值的统计分布特性和前一帧或多帧的空间音频参数对当前帧的空间音频参数作出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差;对当前帧的空间音频参数预测残差进行编码得到编码码流。解码过程:从编码码流中解码得到帧信号的空间音频参数预测残差;用之前重建得到的一帧或多帧空间音频参数及当前帧的空间音频参数预测残差,得到空间音频参数预测系数,然后重建得到当前帧的空间音频参数。本发明考虑了空间音频参数的时域相关性,可有效降低编码码率。
  • 音频带宽扩展编解码装置-200910061441.1
  • 胡瑞敏;杭波;方圆;马晔;王晓晨;周成 - 武汉大学
  • 2009-04-08 - 2009-09-02 - G10L19/04
  • 本发明提供了音频带宽扩展编解码装置,能够用较少的码率对高频信号进行重建,以提高输出音频信号质量。音频带宽扩展编码装置包括分频模块、核心编码器模块、线性预测分析模块、频谱包络量化模块、高低频相关性计算模块和增益计算模块;音频带宽扩展解码装置包括核心解码器模块、高频谱包络重建模块、高频残差重构模块、高频增益调整模块、高频信号合成模块和宽带信号重建模块。
  • 空间音频参数双向帧间预测编解码装置-200910061440.7
  • 胡瑞敏;杭波;马晔;周成;王晓晨 - 武汉大学
  • 2009-04-08 - 2009-09-02 - G10L19/04
  • 本发明提供了空间音频参数双向帧间预测编解码装置。其中编码装置包括空间音频参数提取模块,用于对输入的多声道音频信号的帧信号分子带提取空间音频参数;空间音频参数预测模块,用于得到当前帧的空间音频参数的预测系数和预测残差;空间音频参数编码模块,用于将当前帧的空间音频参数的预测系数和预测残差进行编码。其中解码装置包括空间音频参数解码模块,用于从编码码流的帧信号中得到该帧的空间音频参数的预测系数和预测残差;空间音频参数重建模块,用于重建得到当前帧的空间音频参数。本发明考虑了空间音频参数的时域相关性,可有效降低编码码率。
  • 矢量量化方法及矢量量化器-200710181297.6
  • 李立雄;吴文海;张德军;胡翔宇;王庭红;张亮 - 华为技术有限公司
  • 2007-10-25 - 2009-04-29 - G10L19/04
  • 本发明涉及编码技术,公开了矢量量化方法和矢量量化器,其中矢量量化方法包括:获取待量化矢量,对待量化矢量进行N级量化,获得N级量化后的残差矢量,其中N为正整数;计算与残差矢量需要修正的各个维一一对应的调整量的值,获得由各个调整量的值组成的调整矢量;将调整矢量按照预置的分组方法分成若干个调整子矢量,每个调整子矢量由一个或一个以上的调整量组成,根据所包含的调整量的值确定每个调整子矢量的综合索引号;判断各个调整子矢量的综合索引号是否满足预置编码空间,若否,则调整该调整子矢量所包含的调整量的值,使得该调整子矢量的综合索引号满足预置编码空间。使用本发明实施例提供的技术方案,可以减少编码所需的编码空间。
  • 调整门限值的方法及检测模块-200710154176.2
  • 张立斌;张琦 - 华为技术有限公司
  • 2007-09-19 - 2009-03-25 - G10L19/04
  • 本发明实施例公开了一种调整门限值的方法,包括:判断接收的信号的信号特性;若判断出所述信号表征出无用信号特性,进一步判断是否出现连续的无用信号,若判断出所述信号表征出有用信号特性,进一步判断是否出现连续的有用信号;如果出现连续的无用信号,则增加门限附加修正值,如果出现连续的有用信号,则减小门限附加修正值;将原有用于比较的门限值加上所述增加或减小后的门限附加修正值作为进行比较的门限值。相应的,本发明实施例还提供一种检测模块。本发明实施例技术方案能够提高信号判决的正确率。
  • 一种可配置参数的立体声编码装置及其编码方法-200710152226.3
  • 钟毅睿 - 中兴通讯股份有限公司
  • 2007-09-19 - 2009-03-25 - G10L19/04
  • 本发明公开了一种可配置参数的立体声编码装置,预处理模块用于将立体声音频信号转换为和差声道信号,并进行线性滤波预测分析,得到和声道残差信号和差声道残差信号;信号估计模块用于通过利用和声道的残差估计差声道的残差,得到差声道残差的估计信号;系数提取模块用于进行时频变换,将时频变换后得到的频域系数进行低频和高频提取;增益计算模块用于得到原始的左右声道高频成份与估计的左右声道高频成份,进而得左右声道的增益系数;数据编码模块用于进行量化编码并形成编码数据流。本发明还公开了一种可配置参数的立体声编码方法。本发明既能保持编码质量,又能降低编码复杂度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top