[发明专利]音频识别、回声消除方法、装置及设备有效
| 申请号: | 201710081881.8 | 申请日: | 2017-02-15 |
| 公开(公告)号: | CN108429994B | 公开(公告)日: | 2020-10-09 |
| 发明(设计)人: | 薛少飞;田彪 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | H04R3/00 | 分类号: | H04R3/00 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 识别 回声 消除 方法 装置 设备 | ||
本申请提供一种音频识别、回声消除方法、装置及设备,所述回声消除方法包括:获取音箱数据和麦克风数据;若所述音箱数据不为空时,将所述音箱数据和所述麦克风数据输入预先生成的种类判断模型,根据判断结果确定所述麦克风数据的种类;在种类为非双讲型时,调整滤波器系数;在种类为双讲型时,固定滤波器系数,并对所述麦克风数据进行回声消除;其中,所述种类判断模型以音箱样本数据、麦克风样本数据作为分类器的输入参数,并以麦克风样本数据的种类作为分类器的分类目标训练生成,所述麦克风样本数据基于音箱样本数据生成。应用本申请方案可以提高判断麦克风数据的种类准确性,进而提高回声消噪效果。
技术领域
本申请涉及语音交互技术领域,尤其涉及音频识别、回声消除方法、装置及设备。
背景技术
在电话会议系统、车载系统、IP电话等语音交互系统中,经常会出现扬声器播放的声音经过多种路径传播后被麦克风拾取,并传回到系统形成回声现象。以即时通讯为例进行说明,在进行双方或多方的实时语音交流时,通常采用外置音箱放音,当甲方说话后,通过乙方的音箱放音,声音经过信道传播后连同乙方的话音被乙方的麦克风采集并回传给甲方,从而导致甲方能听到自己的声音。如果不对回音进行处理,将会影响通话质量和用户体验,严重时还会形成震荡,产生啸叫。
为了避免回声带来的不利影响,可以采用回声消除器(Acoustic EchoCanceller,AEC)将本地音箱播放出来的声音从麦克风采集的麦克风数据中消除,使得麦克风录制的声音只有本地用户说话的声音。通常采用自适应滤波器模拟回声路径,并将估计的回声数据从麦克风拾取的麦克风数据中消除。自适应滤波器是以输入数据和输出数据的统计特性的估计为依据,采取特定算法自动地调整滤波器系数,使其达到最佳滤波特性的一种算法。其中,输入数据为音箱播报的音箱数据,可以称为参考信号;输出数据为由音箱数据产生的回音数据,可以称为期望信号。
自适应滤波器收敛阶段,回音数据是由音箱数据产生的回音数据,回音数据中不能有用户说话的语音数据,在没有语音数据的阶段中,自适应滤波器的滤波器系数不断迭代收敛,而一旦有用户语音进入,则需要固定滤波器系数,以便利用自适应滤波器进行回声消除。基于此,准确判断麦克风数据的种类,是合理调整滤波器系数的关键。输入数据中包括麦克风数据和音箱数据,麦克风数据基于音箱数据生成。先判断音箱数据是否为空,如果音箱数据为空,则不进行双讲判断和AEC处理,如果音箱数据不为空,则判断麦克风数据的种类为双讲型还是非双讲型。当麦克风数据的种类为双讲型时,固定滤波器系数并对麦克风数据进行回声消除;当麦克风数据的种类为非双讲型时,对滤波器系数进行调整。双讲型数据是同时基于音箱数据和语音数据生成的数据,非双讲型数据是没有同时包括音箱数据和语音数据的数据。
现有技术中,在确定是否调整滤波器系数之前,往往基于能量阈值的方式判断麦克风采集的麦克风数据的种类,在存在风噪等噪声的复杂环境下,仅通过阈值的方式判断种类是否为双讲型或非双讲型,判断准确性差,从而导致回声消噪效果差。
发明内容
本申请提供音频识别、回声消除方法、装置及设备,以解决现有技术种类判断不准确的问题。
根据本申请实施例的第一方面,提供一种回声消除方法,所述方法包括:
获取音箱数据和麦克风数据;
若所述音箱数据不为空时,将所述音箱数据和所述麦克风数据输入预先生成的种类判断模型,根据判断结果确定所述麦克风数据的种类;
在种类为非双讲型时,调整滤波器系数;在种类为双讲型时,固定滤波器系数,并对所述麦克风数据进行回声消除;
其中,所述种类判断模型以音箱样本数据、麦克风样本数据作为分类器的输入参数,并以麦克风样本数据的种类作为分类器的分类目标训练生成,所述麦克风样本数据基于音箱样本数据生成。
根据本申请实施例的第二方面,提供一种音频识别方法,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710081881.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便携式无线充电音响
- 下一篇:音响处理装置、音响处理方法以及存储介质





