[发明专利]音频编码方法及装置、音频解码方法及装置有效

申请号：	202011284231.1	申请日：	2020-11-17
公开（公告）号：	CN112259110B	公开（公告）日：	2022-07-01
发明（设计）人：	冯大航;陈孝良;傅东辉	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L19/008	分类号：	G10L19/008;G10L19/04;G10L21/0208;G10L25/12;G10L25/30
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	黄灿;左晓菲
地址：	100094 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频编码方法装置解码
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音频编码方法，其特征在于，所述方法包括：

获取声源定位结果，其中，所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果，M为正整数；

采用预先获取的去混响系数对所述M个通道的音频信号进行去混响，得到M个去混响音频信号；

基于所述声源定位结果对所述M个去混响音频信号进行波束形成，得到波束输出信号；

基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码，得到编码码流；

生成所述音频信号的编码结果，所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流；

其中，用于线性预测的参考信号为所述波束输出信号。

2.根据权利要求1所述的方法，其特征在于，所述获取声源定位结果，包括：

获取所述M个通道的音频信号的语音活动检测结果；

在所述语音活动检测结果为人声信号的情况下，获取声源定位结果。

3.根据权利要求2所述的方法，其特征在于，所述编码结果还包括所述语音活动检测结果。

4.根据权利要求1所述的方法，其特征在于，所述基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码，得到编码码流，包括：

对所述波束输出信号及所述M个去混响音频信号中的M-1个去混响音频信号进行线性预测编码，得到预测残差；

对预先获取的线性预测系数和所述预测残差进行熵编码，得到编码码流。

5.一种音频解码方法，其特征在于，所述方法包括：

获取M个通道的音频信号的编码结果，所述编码结果包括声源定位结果、去混响系数及编码码流，M为正整数；

从所述编码结果中分离出所述声源定位结果、去混响系数及编码码流；

基于所述声源定位结果对所述编码码流进行解码，获取M个去混响音频信号；

基于所述去混响系数对所述M个去混响音频信号进行去混响重构，得到所述音频信号的解码结果。

6.根据权利要求5所述的方法，其特征在于，所述基于所述声源定位结果对所述编码码流进行解码，获取M个去混响音频信号，包括：

对所述编码码流进行解码，得到线性预测系数和预测残差；

基于所述线性预测系数和预测残差进行线性预测重构，得到波束输出信号和M-1个去混响音频信号；

根据所述声源定位结果、所述波束输出信号及所述M-1个去混响音频信号进行逆波束形成，得到重构音频信号；

所述M个去混响音频信号包括所述M-1个去混响音频信号和所述重构音频信号。

7.根据权利要求6所述的方法，其特征在于，用于线性预测重构的参考信号为所述波束输出信号。

8.一种音频编码装置，其特征在于，所述装置包括：

获取模块，用于获取声源定位结果，其中，所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果，M为正整数；

去混响模块，用于采用预先获取的去混响系数对所述M个通道的音频信号进行去混响，得到M个去混响音频信号；

波束形成模块，用于基于所述声源定位结果对所述M个去混响音频信号进行波束形成，得到波束输出信号；

编码模块，用于基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码，得到编码码流；

生成模块，用于生成所述音频信号的编码结果，所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流；

其中，用于线性预测的参考信号为所述波束输出信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司，未经北京声智科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011284231.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载