[发明专利]一种移动音源空间音频参数预测编解码方法及系统无效

申请号：	200910272282.X	申请日：	2009-09-28
公开（公告）号：	CN101673549A	公开（公告）日：	2010-03-17
发明（设计）人：	胡瑞敏;周成;高丽;杭波;王晓晨	申请（专利权）人：	武汉大学
主分类号：	G10L19/04	分类号：	G10L19/04
代理公司：	武汉华旭知识产权事务所	代理人：	周宗贵
地址：	43007***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种移动音源空间音频参数预测解码方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及音频技术领域，尤其涉及一种移动音源空间音频参数预测编解码方法及系统。

背景技术

空间音频编码的理论基础是人耳空间听觉的生理声学和心理声学。1983年Blauert等对人耳的单声源和多声源空间定位给出了数学物理模型及实验分析，定义了耳间时间差ITD、耳间强度差ILD以及耳间相关度IC等空间线索参数。其中，ITD和ILD分别表示同一声源发出的声音到达左、右耳的时间差和强度差，通过这两个参数可以定位声源的位置，IC是左、右耳入声相似度的测度，可以确定声像的宽度。2001年Faller和Baumgarte等提出双耳线索编码方法(BCC，Binaural Cue Coding)，将立体声信号下混为单声道信号交由传统编码器编码，同时对由输入信号中提取的空间音频参数单独编码，解码时根据单声道信号和空间音频参数共同重建立体声信号。

基于音频对象在空间的移动是一个连续过程，表征音频对象空间方位的音频空间音频参数在时域上存在相关性。针对音频空间音频参数的时域相关特性，当前主流空间音频编码算法EAAC+采用了一种差分哈夫曼编码算法，对本帧和前一帧的空间音频参数差值作哈夫曼编码，目的是为了缩小空间音频参数编码数值动态范围，降低空间音频编码码率。这种差分编码方法将前一帧的空间音频参数作为当前帧的预测值，未考虑到移动音源空间音频参数变化，仍有提升的空间。

发明内容

本发明的目的是提供一种移动音源空间音频参数预测编解码方法及系统，以消除编码冗余，根据多普勒效应、运动学原理、几何声学原理和波动声学原理来预测当前帧空间音频参数，然后对实际值和预测值的差(即空间音频参数预测误差)进行编解码。

为达到上述目的，本发明采用如下的技术方案：

一种移动音源空间音频参数预测编码方法，包括以下步骤：

①输入多声道音频信号；

②对输入的多声道音频信号提取空间音频参数；

③根据移动音源速度对当前帧的空间音频参数做出预测，得到当前帧的空间音频参数预测系数和空间音频参数预测残差；

④对当前帧的空间音频参数预测残差进行编码得到编码码流。

所述步骤②执行后，获得耳间时间差ITD和耳间强度差ILD；

所述步骤③中，根据所述耳间时间差ITD减去所述预测双耳时间差ITD得到双耳时间差 ITD预测残差，根据所述耳间强度差ILD减去所述预测耳间强度差ILD得到耳间强度差ILD 预测残差；

其中，所述预测双耳时间差ITD为：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。