[发明专利]音频优化方法及相关装置、电子设备、存储介质在审

专利信息
申请号: 202111088953.4 申请日: 2021-09-16
公开(公告)号: CN113990337A 公开(公告)日: 2022-01-28
发明(设计)人: 马峰;李明子 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G10L21/0208 分类号: G10L21/0208;G10L21/0216;G10L25/27
代理公司: 深圳市威世博知识产权代理事务所(普通合伙) 44280 代理人: 刘希
地址: 230088 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 优化 方法 相关 装置 电子设备 存储 介质
【说明书】:

本申请公开了一种音频优化方法及相关装置、电子设备、存储介质,其中,音频优化方法包括:提取采集音频的第一音频表示,并提取参考音频的第二音频表示;基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示;将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示;其中,交互处理包括:回声抑制、噪声抑制、语音增强;基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频。上述方案,能够提高音频优化效果。

技术领域

本申请涉及音频处理技术领域,特别是涉及一种音频优化方法及相关装置、电子设备、存储介质。

背景技术

在现实场景中,由于手机、智能音箱、电视等电子设备中扬声器与麦克风存在耦合,麦克风会采集扬声器发出的信号,从而形成回声系统,且环境中也不可避免地存在噪声,进而音频质量将会受到较大的影响。

以通信领域为例,如果近端说话人和扬声器播放的远端说话人的声音同时传向远端,经过网络传输产生时延,远端说话人会听到自己的回声以及环境噪声,严重影响通话体验,甚至造成沟通障碍;或者,以智能硬件领域为例,在对智能电视、智能音箱等同时具备播放与交互功能的电子设备进行交互控制时,声音播放源相较于说话人来说,通常离麦克风近得多,从而影响交互识别。虽然目前已经提出若干音频优化算法,但优化效果均不理想。有鉴于此,如何提高音频优化效果成为亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种音频优化方法及相关装置、电子设备、存储介质,能够提高音频优化效果。

为了解决上述技术问题,本申请第一方面提供了一种音频优化方法,包括:提取采集音频的第一音频表示,并提取参考音频的第二音频表示;基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示;将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示;其中,交互处理包括:回声抑制、噪声抑制、语音增强;基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频。

为了解决上述技术问题,本申请第二方面提供了一种音频优化装置,包括:音频特征提取模块、声音表示提取模块、声音表示交互模块和目标音频获取模块,音频特征提取模块,用于提取采集音频的第一音频表示,并提取参考音频的第二音频表示;声音表示提取模块,用于基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示;声音表示交互模块,用于将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示;其中,交互处理包括:回声抑制、噪声抑制、语音增强;目标音频获取模块,用于基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频。

为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的音频优化方法。

为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的音频优化方法。

上述方案,提取采集音频的第一音频表示,并提取参考音频的第二音频表示,基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示,在此基础上,再将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示,且交互处理包括:回声抑制、噪声抑制、语音增强,并基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频,由于第一语音表示和第一回声表示进行交互处理,有利于抑制回声并增强语音,而第一语音表示和第一噪声表示进行交互处理,有利于抑制噪声并增强语音,故在音频优化过程中,能够考虑到不同信号的统计特性,而采用并行方式交互处理第一语音表示和第一回声表示,以及第一语音表示和第一噪声表示,有利于提升提高音频优化效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111088953.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top