[发明专利]一种移动音源空间音频参数预测编解码方法及系统无效
| 申请号: | 200910272282.X | 申请日: | 2009-09-28 |
| 公开(公告)号: | CN101673549A | 公开(公告)日: | 2010-03-17 |
| 发明(设计)人: | 胡瑞敏;周成;高丽;杭波;王晓晨 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G10L19/04 | 分类号: | G10L19/04 |
| 代理公司: | 武汉华旭知识产权事务所 | 代理人: | 周宗贵 |
| 地址: | 43007*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 移动 音源 空间 音频 参数 预测 解码 方法 系统 | ||
1.一种移动音源空间音频参数预测编码方法,其特征在于,包括以下步骤:
①输入多声道音频信号;
②对输入的多声道音频信号提取空间音频参数;
③根据移动音源速度对当前帧的空间音频参数做出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差;
④对当前帧的空间音频参数预测残差进行编码得到编码码流;
所述步骤②执行后,获得耳间时间差ITD和耳间强度差ILD;
所述步骤③中,根据耳间时间差ITD减去预测耳间时间差ITD得到耳间时间差ITD预测残差,根据耳间强度差ILD减去预测耳间强度差ILD得到耳间强度差ILD预测残差;
其中,对于水平面θ(t)方向输入的平面声波,所述预测耳间时间差ITD为:
所述预测耳间强度差ILD为:
其中,移动音源在介质中传播速度为u、频率为 ,其从初始位置A(r0,θ0)以恒定水平速度v经过时间t=Δt*f移动到位置B(rt,θt),r,θ分别为半径与方位角,Δt为帧间时间间隔,f为当前帧帧数,头部近似成半径为a的球体,双耳近似成球面上相对的两点。
2.一种移动音源空间音频参数预测解码方法,其特征在于,包括以下步骤:
①输入编码码流;
②从编码码流中解码得到空间音频参数预测残差;
③根据移动音源速度和当前帧空间音频参数预测残差重建当前帧空间音频参数;
所述步骤②执行后,获得耳间时间差ITD预测残差和耳间强度差ILD预测残差;
所述步骤③中,根据耳间时间差ITD预测残差加上预测耳间时间差ITD得到耳间时间差ITD,根据耳间强度差ILD预测残差加上预测耳间强度差ILD得到耳间强度差ILD;
其中,对于水平面θ(t)方向输入的平面声波,所述预测耳间时间差ITD为:
所述预测耳间强度差ILD为:
其中,移动音源在介质中传播速度为u、频率为 ,其从初始位置A(r0,θ0)以恒定水平速度v经过时间t=Δt*f移动到位置B(rt,θt),r,θ分别为半径与方位角,Δt为帧间时间间隔,f为当前帧帧数,头部近似成半径为a的球体,双耳近似成球面上相对的两点。
3.一种移动音源空间音频参数预测编解码系统,其特征在于,包括:
空间音频参数提取模块(1)接收输入多声道音频信号(6),从输入多声道音频信号中提取耳间时间差ITD和耳间强度差ILD并输出给空间音频参数预测模块(2);
空间音频参数预测模块(2)接收耳间时间差ITD和耳间强度差ILD,将耳间时间差ITD减去预测耳间时间差ITD得到耳间时间差ITD预测残差,将耳间强度差ILD减去预测耳间强度差ILD得到耳间强度差ILD预测残差,
其中,对于水平面θ(t)方向入射的平面声波,所述预测耳间时间差ITD为:
所述预测耳间强度差ILD为:
其中,移动音源在介质中传播速度为u、频率为 ,其从初始位置A(r0,θ0)以恒定水平速度v经过时间t=Δt*f移动到位置B(rt,θt),r,θ分别为半径与方位角,Δt为帧间时间间隔,f为当前帧帧数,头部近似成半径为a的球体,双耳近似成球面上相对的两点;
将耳间时间差ITD预测残差和耳间强度差ILD预测残差输出给空间音频参数编码模块(3);
空间音频参数编码模块(3)接收耳间时间差ITD预测残差和耳间强度差ILD预测残差,对耳间时间差ITD预测残差和耳间强度差ILD预测残差进行编码得到编码码流,并将编码码流输出给空间音频参数解码模块(4);
空间音频参数解码模块(4)接收编码码流,用于从编码码流中解码得到耳间时间差ITD预测残差和耳间强度差ILD预测残差并输出给空间音频参数重建模块(5);
空间音频参数重建模块(5)接收耳间时间差ITD预测残差和耳间强度差ILD预测残差,将耳间时间差ITD预测残差加上预测耳间时间差ITD得到耳间时间差ITD,将耳间强度差ILD预测残差加上预测耳间强度差ILD得到耳间强度差ILD;
其中,对于水平面θ(t)方向入射的平面声波,所述预测耳间时间差ITD为:
所述预测耳间强度差ILD为:
其中,移动音源在介质中传播速度为u、频率为 ,其从初始位置A(r0,θ0)以恒定水平速度v经过时间t=Δt*f移动到位置B(rt,θt),r,θ分别为半径与方位角,Δt为帧间时间间隔,f为当前帧帧数,头部近似成半径为a的球体,双耳近似成球面上相对的两点;
输出耳间时间差ITD和耳间强度差ILD,即空间音频参数(7)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910272282.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:旋光异构体分离剂
- 下一篇:一种在线编程的FPGA可重构装置





