[发明专利]音频编码方法及装置、音频解码方法及装置有效
申请号: | 202011284231.1 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112259110B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 冯大航;陈孝良;傅东辉 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/04;G10L21/0208;G10L25/12;G10L25/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;左晓菲 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 方法 装置 解码 | ||
本公开提供一种音频编码方法及装置、音频解码方法及装置,所述音频编码方法包括:获取声源定位结果,其中,所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果,M为正整数;采用预先获取的去混响系数对所述M个通道的音频信号进行去混响,得到M个去混响音频信号;基于所述声源定位结果对所述M个去混响音频信号进行波束形成,得到波束输出信号;基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码,得到编码码流;生成所述音频信号的编码结果,所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流。本公开实施例能够提高对多通道的音频信号进行音频压缩的效果。
技术领域
本发明涉及音频编解码技术领域,尤其涉及一种音频编码方法及装置、音频解码方法及装置。
背景技术
随着电子设备向智能化发展,电子设备通常集成有语音唤醒、语音识别及声纹识别等功能以实现语音交互。为提高语音交互的效果,电子设备通常设置麦克风阵列以采集多通道的音频信号。相关技术中,在采集多通道的音频信号后,对该多通道的音频信号进行线性预测编码以对麦克风阵列的多通道音频信号进行音频压缩。然而,线性预测编码是较为简单的去相关编码算法,采用线性预测编码对多通道的音频信号进行音频压缩的效果较差。
发明内容
本公开实施例提供一种音频编码方法及装置、音频解码方法及装置,以解决采用线性预测编码对多通道的音频信号进行音频压缩的效果较差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本公开实施例提供了一种音频编码方法,所述方法包括:
获取声源定位结果,其中,所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果,M为正整数;
采用预先获取的去混响系数对所述M个通道的音频信号进行去混响,得到M个去混响音频信号;
基于所述声源定位结果对所述M个去混响音频信号进行波束形成,得到波束输出信号;
基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码,得到编码码流;
生成所述音频信号的编码结果,所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流。
第二方面,本公开实施例提供了一种音频解码方法,所述方法包括:
获取M个通道的音频信号的编码结果,所述编码结果包括声源定位结果、去混响系数及编码码流,M为正整数;
从所述编码结果中分离出所述声源定位结果、去混响系数及编码码流;
基于所述声源定位结果对所述编码码流进行解码,获取M个去混响音频信号;
基于所述去混响系数对所述M个去混响音频信号进行去混响重构,得到所述音频信号的解码结果。
第三方面,本公开实施例提供了一种音频编码装置,所述装置包括:
获取模块,用于获取声源定位结果,其中,所述声源定位结果为根据M个通道的音频信号进行声源定位的声源定位结果,M为正整数;
去混响模块,用于采用预先获取的去混响系数对所述M个通道的音频信号进行去混响,得到M个去混响音频信号;
波束形成模块,用于基于所述声源定位结果对所述M个去混响音频信号进行波束形成,得到波束输出信号;
编码模块,用于基于所述M个去混响音频信号和所述波束输出信号进行线性预测编码,得到编码码流;
生成模块,用于生成所述音频信号的编码结果,所述编码结果包括所述声源定位结果、所述去混响系数及所述编码码流。
第四方面,本公开实施例提供了一种音频解码装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011284231.1/2.html,转载请声明来源钻瓜专利网。