[发明专利]一种移动音源空间音频参数预测编解码方法及系统无效
| 申请号: | 200910272282.X | 申请日: | 2009-09-28 |
| 公开(公告)号: | CN101673549A | 公开(公告)日: | 2010-03-17 |
| 发明(设计)人: | 胡瑞敏;周成;高丽;杭波;王晓晨 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G10L19/04 | 分类号: | G10L19/04 |
| 代理公司: | 武汉华旭知识产权事务所 | 代理人: | 周宗贵 |
| 地址: | 43007*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 移动 音源 空间 音频 参数 预测 解码 方法 系统 | ||
技术领域
本发明涉及音频技术领域,尤其涉及一种移动音源空间音频参数预测编解码方法及系统。
背景技术
空间音频编码的理论基础是人耳空间听觉的生理声学和心理声学。1983年Blauert等对 人耳的单声源和多声源空间定位给出了数学物理模型及实验分析,定义了耳间时间差ITD、 耳间强度差ILD以及耳间相关度IC等空间线索参数。其中,ITD和ILD分别表示同一声源 发出的声音到达左、右耳的时间差和强度差,通过这两个参数可以定位声源的位置,IC是左、 右耳入声相似度的测度,可以确定声像的宽度。2001年Faller和Baumgarte等提出双耳线索 编码方法(BCC,Binaural Cue Coding),将立体声信号下混为单声道信号交由传统编码器编 码,同时对由输入信号中提取的空间音频参数单独编码,解码时根据单声道信号和空间音频 参数共同重建立体声信号。
基于音频对象在空间的移动是一个连续过程,表征音频对象空间方位的音频空间音频参 数在时域上存在相关性。针对音频空间音频参数的时域相关特性,当前主流空间音频编码算 法EAAC+采用了一种差分哈夫曼编码算法,对本帧和前一帧的空间音频参数差值作哈夫曼编 码,目的是为了缩小空间音频参数编码数值动态范围,降低空间音频编码码率。这种差分编 码方法将前一帧的空间音频参数作为当前帧的预测值,未考虑到移动音源空间音频参数变化, 仍有提升的空间。
发明内容
本发明的目的是提供一种移动音源空间音频参数预测编解码方法及系统,以消除编码冗 余,根据多普勒效应、运动学原理、几何声学原理和波动声学原理来预测当前帧空间音频参 数,然后对实际值和预测值的差(即空间音频参数预测误差)进行编解码。
为达到上述目的,本发明采用如下的技术方案:
一种移动音源空间音频参数预测编码方法,包括以下步骤:
①输入多声道音频信号;
②对输入的多声道音频信号提取空间音频参数;
③根据移动音源速度对当前帧的空间音频参数做出预测,得到当前帧的空间音频参数预 测系数和空间音频参数预测残差;
④对当前帧的空间音频参数预测残差进行编码得到编码码流。
所述步骤②执行后,获得耳间时间差ITD和耳间强度差ILD;
所述步骤③中,根据所述耳间时间差ITD减去所述预测双耳时间差ITD得到双耳时间差 ITD预测残差,根据所述耳间强度差ILD减去所述预测耳间强度差ILD得到耳间强度差ILD 预测残差;
其中,所述预测双耳时间差ITD为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910272282.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:旋光异构体分离剂
- 下一篇:一种在线编程的FPGA可重构装置





