[发明专利]音频编码方法及装置、音频解码方法及装置有效
申请号: | 202011284231.1 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112259110B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 冯大航;陈孝良;傅东辉 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/04;G10L21/0208;G10L25/12;G10L25/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;左晓菲 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 方法 装置 解码 | ||
1.一种音频编码方法,其特征在于,所述方法包括:
获取声源定位结果,其中,所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果,M为正整数;
采用预先获取的去混响系数对所述M个通道的音频信号进行去混响,得到M个去混响音频信号;
基于所述声源定位结果对所述M个去混响音频信号进行波束形成,得到波束输出信号;
基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码,得到编码码流;
生成所述音频信号的编码结果,所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流;
其中,用于线性预测的参考信号为所述波束输出信号。
2.根据权利要求1所述的方法,其特征在于,所述获取声源定位结果,包括:
获取所述M个通道的音频信号的语音活动检测结果;
在所述语音活动检测结果为人声信号的情况下,获取声源定位结果。
3.根据权利要求2所述的方法,其特征在于,所述编码结果还包括所述语音活动检测结果。
4.根据权利要求1所述的方法,其特征在于,所述基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码,得到编码码流,包括:
对所述波束输出信号及所述M个去混响音频信号中的M-1个去混响音频信号进行线性预测编码,得到预测残差;
对预先获取的线性预测系数和所述预测残差进行熵编码,得到编码码流。
5.一种音频解码方法,其特征在于,所述方法包括:
获取M个通道的音频信号的编码结果,所述编码结果包括声源定位结果、去混响系数及编码码流,M为正整数;
从所述编码结果中分离出所述声源定位结果、去混响系数及编码码流;
基于所述声源定位结果对所述编码码流进行解码,获取M个去混响音频信号;
基于所述去混响系数对所述M个去混响音频信号进行去混响重构,得到所述音频信号的解码结果。
6.根据权利要求5所述的方法,其特征在于,所述基于所述声源定位结果对所述编码码流进行解码,获取M个去混响音频信号,包括:
对所述编码码流进行解码,得到线性预测系数和预测残差;
基于所述线性预测系数和预测残差进行线性预测重构,得到波束输出信号和M-1个去混响音频信号;
根据所述声源定位结果、所述波束输出信号及所述M-1个去混响音频信号进行逆波束形成,得到重构音频信号;
所述M个去混响音频信号包括所述M-1个去混响音频信号和所述重构音频信号。
7.根据权利要求6所述的方法,其特征在于,用于线性预测重构的参考信号为所述波束输出信号。
8.一种音频编码装置,其特征在于,所述装置包括:
获取模块,用于获取声源定位结果,其中,所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果,M为正整数;
去混响模块,用于采用预先获取的去混响系数对所述M个通道的音频信号进行去混响,得到M个去混响音频信号;
波束形成模块,用于基于所述声源定位结果对所述M个去混响音频信号进行波束形成,得到波束输出信号;
编码模块,用于基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码,得到编码码流;
生成模块,用于生成所述音频信号的编码结果,所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流;
其中,用于线性预测的参考信号为所述波束输出信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011284231.1/1.html,转载请声明来源钻瓜专利网。