[发明专利]音频编码设备和方法有效
申请号: | 201880090899.7 | 申请日: | 2018-03-14 |
公开(公告)号: | CN111819862B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 穆罕默德·塔吉扎德;克里斯托弗·富勒;亚历克西斯·法夫罗 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04R1/40 | 分类号: | H04R1/40;H04S3/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 设备 方法 | ||
1.一种音频编码设备(3),其特征在于,所述音频编码设备(3)用于编码来自N个麦克风的N个音频信号,其中N≥3,所述音频编码设备(3)包括:
延迟估计器(11),所述延迟估计器(11)用于通过估计所述N个音频信号中的每一对音频信号的直接声音的入射角来估计直接声音的入射角;
波束导出器(12),所述波束导出器(12)用于通过为每个估计的入射角分别导出一个A格式的直接声音信号来为所述估计的多个入射角导出多个A格式的直接声音信号,每个A格式的直接声音信号是一阶虚拟麦克风信号;
编码器(13),所述编码器(13)用于通过对所述多个A格式的直接声音信号应用变换矩阵,将所述多个A格式的直接声音信号编码成一阶Ambisonic B格式的直接声音信号。
2.根据权利要求1所述的音频编码设备(3),其特征在于,
N=3,所述音频编码设备(3)包括短时傅里叶变换器(10a、10b、10c),用于对N个音频信号x1、x2、x3中的每个音频信号进行短时傅里叶变换,以得到N个短时傅里叶变换音频信号X1[k,i]、X2[k,i]、X3[k,i],
所述延迟估计器(11)用于:
根据以下公式确定短时傅里叶变换音频信号中的每一对音频信号的交叉频谱:
根据以下公式确定短时傅里叶变换音频信号中的每一对音频信号的复合交叉频谱的夹角:
对执行相位展开,以得到Ψ12、Ψ13、Ψ23,
根据以下公式估计以样点数量表示的延迟:
δ12[k,i]=(NSTFT/2+1)/(iπ)ψ12[k,i],
δ13[k,i]=(NSTFT/2+1)/(iπ)ψ13[k,i],
δ23[k,i]=(NSTFT/2+1)/(iπ)ψ23[k,i],i≤ialias
或
δ12[k,i]=(NSTFT/2+1)/(iπ)Ψ12[k,i],
δ13[k,i]=(NSTFT/2+1)/(iπ)Ψ13[k,i],
δ23[k,i]=(NSTFT/2+1)/(iπ)Ψ23[k,i],i>ialias
根据以下公式估计以秒表示的延迟:
根据以下公式估计入射角:
其中
x1为所述N个音频信号中的第一音频信号,
x2为所述N个音频信号中的第二音频信号,
x3为所述N个音频信号中的第三音频信号,
X1为第一短时傅里叶变换后的音频信号,
X2为第二短时傅里叶变换后的音频信号,
X3为第三短时傅里叶变换后的音频信号,
k为所述短时傅里叶变换后的音频信号的帧,
i为所述短时傅里叶变换后的音频信号的频点,X12为X1和X2对的交叉频谱,
X13为X1和X3对的交叉频谱,
X23为X2和X3对的交叉频谱,
αX为遗忘因子,
X*为X的共轭复数,
j为虚数单位,
为复合交叉频谱X12的夹角,
为复合交叉频谱X13的夹角,
为复合交叉频谱X23的夹角,
ψ12为频率混叠中展开相位ψ12的平均值,
Ψ13为频率混叠中展开相位Ψ13的平均值,
Ψ23为频率混叠中展开相位Ψ23的平均值,
ialias为混叠频率对应的频点,
fs为采样频率,
dmic为麦克风(2、2a、2b、2c)的距离,
c为声速。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880090899.7/1.html,转载请声明来源钻瓜专利网。