[发明专利]音频编码方法及装置、音频解码方法及装置有效

申请号：	202011284231.1	申请日：	2020-11-17
公开（公告）号：	CN112259110B	公开（公告）日：	2022-07-01
发明（设计）人：	冯大航;陈孝良;傅东辉	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L19/008	分类号：	G10L19/008;G10L19/04;G10L21/0208;G10L25/12;G10L25/30
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	黄灿;左晓菲
地址：	100094 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频编码方法装置解码
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供一种音频编码方法及装置、音频解码方法及装置，所述音频编码方法包括：获取声源定位结果，其中，所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果，M为正整数；采用预先获取的去混响系数对所述M个通道的音频信号进行去混响，得到M个去混响音频信号；基于所述声源定位结果对所述M个去混响音频信号进行波束形成，得到波束输出信号；基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码，得到编码码流；生成所述音频信号的编码结果，所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流。本公开实施例能够提高对多通道的音频信号进行音频压缩的效果。

技术领域

本发明涉及音频编解码技术领域，尤其涉及一种音频编码方法及装置、音频解码方法及装置。

背景技术

随着电子设备向智能化发展，电子设备通常集成有语音唤醒、语音识别及声纹识别等功能以实现语音交互。为提高语音交互的效果，电子设备通常设置麦克风阵列以采集多通道的音频信号。相关技术中，在采集多通道的音频信号后，对该多通道的音频信号进行线性预测编码以对麦克风阵列的多通道音频信号进行音频压缩。然而，线性预测编码是较为简单的去相关编码算法，采用线性预测编码对多通道的音频信号进行音频压缩的效果较差。

发明内容

本公开实施例提供一种音频编码方法及装置、音频解码方法及装置，以解决采用线性预测编码对多通道的音频信号进行音频压缩的效果较差的问题。

为了解决上述技术问题，本发明是这样实现的：

第一方面，本公开实施例提供了一种音频编码方法，所述方法包括：

获取声源定位结果，其中，所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果，M为正整数；

采用预先获取的去混响系数对所述M个通道的音频信号进行去混响，得到M个去混响音频信号；

基于所述声源定位结果对所述M个去混响音频信号进行波束形成，得到波束输出信号；

基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码，得到编码码流；

生成所述音频信号的编码结果，所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流。

第二方面，本公开实施例提供了一种音频解码方法，所述方法包括：

获取M个通道的音频信号的编码结果，所述编码结果包括声源定位结果、去混响系数及编码码流，M为正整数；

从所述编码结果中分离出所述声源定位结果、去混响系数及编码码流；