[发明专利]音频优化方法及相关装置、电子设备、存储介质在审
| 申请号: | 202111088953.4 | 申请日: | 2021-09-16 |
| 公开(公告)号: | CN113990337A | 公开(公告)日: | 2022-01-28 |
| 发明(设计)人: | 马峰;李明子 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/27 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 优化 方法 相关 装置 电子设备 存储 介质 | ||
本申请公开了一种音频优化方法及相关装置、电子设备、存储介质,其中,音频优化方法包括:提取采集音频的第一音频表示,并提取参考音频的第二音频表示;基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示;将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示;其中,交互处理包括:回声抑制、噪声抑制、语音增强;基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频。上述方案,能够提高音频优化效果。
技术领域
本申请涉及音频处理技术领域,特别是涉及一种音频优化方法及相关装置、电子设备、存储介质。
背景技术
在现实场景中,由于手机、智能音箱、电视等电子设备中扬声器与麦克风存在耦合,麦克风会采集扬声器发出的信号,从而形成回声系统,且环境中也不可避免地存在噪声,进而音频质量将会受到较大的影响。
以通信领域为例,如果近端说话人和扬声器播放的远端说话人的声音同时传向远端,经过网络传输产生时延,远端说话人会听到自己的回声以及环境噪声,严重影响通话体验,甚至造成沟通障碍;或者,以智能硬件领域为例,在对智能电视、智能音箱等同时具备播放与交互功能的电子设备进行交互控制时,声音播放源相较于说话人来说,通常离麦克风近得多,从而影响交互识别。虽然目前已经提出若干音频优化算法,但优化效果均不理想。有鉴于此,如何提高音频优化效果成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种音频优化方法及相关装置、电子设备、存储介质,能够提高音频优化效果。
为了解决上述技术问题,本申请第一方面提供了一种音频优化方法,包括:提取采集音频的第一音频表示,并提取参考音频的第二音频表示;基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示;将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示;其中,交互处理包括:回声抑制、噪声抑制、语音增强;基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频。
为了解决上述技术问题,本申请第二方面提供了一种音频优化装置,包括:音频特征提取模块、声音表示提取模块、声音表示交互模块和目标音频获取模块,音频特征提取模块,用于提取采集音频的第一音频表示,并提取参考音频的第二音频表示;声音表示提取模块,用于基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示;声音表示交互模块,用于将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示;其中,交互处理包括:回声抑制、噪声抑制、语音增强;目标音频获取模块,用于基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频。
为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的音频优化方法。
为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的音频优化方法。
上述方案,提取采集音频的第一音频表示,并提取参考音频的第二音频表示,基于第一音频表示和第二音频表示,分别提取得到第一回声表示、第一语音表示和第一噪声表示,在此基础上,再将第一语音表示分别与第一回声表示、第一噪声表示进行交互处理,得到第二语音表示、第二回声表示和第二噪声表示,且交互处理包括:回声抑制、噪声抑制、语音增强,并基于第二语音表示、第二回声表示和第二噪声表示中至少一者,得到优化之后的目标音频,由于第一语音表示和第一回声表示进行交互处理,有利于抑制回声并增强语音,而第一语音表示和第一噪声表示进行交互处理,有利于抑制噪声并增强语音,故在音频优化过程中,能够考虑到不同信号的统计特性,而采用并行方式交互处理第一语音表示和第一回声表示,以及第一语音表示和第一噪声表示,有利于提升提高音频优化效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111088953.4/2.html,转载请声明来源钻瓜专利网。





