[发明专利]一种音频优化方法、装置、系统及介质在审
申请号: | 202011032128.8 | 申请日: | 2020-09-27 |
公开(公告)号: | CN114360484A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 许嘉璐;周多莹;易亚雯 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/033;G10L15/04;G10L25/03;G10L25/30;G10L25/78;H04N21/439 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王春波 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 优化 方法 装置 系统 介质 | ||
一种音频优化方法、装置、系统及介质。该方法可以用于人工智能(artificial intelligence,AI)终端。该方法包括:接收收音群组中的设备发送的候选音频,所述收音群组包括至少一个设备,所述候选音频为目标场景中至少一种声音类型的音频,所述目标场景为所述收音群组中的设备所在的环境对应的场景,每种所述声音类型对应至少一个候选音频;从候选音频集合中,确定每种所述声音类型对应的一个候选音频,所述候选音频集合包括所述收音群组中的设备发送的候选音频;对确定出的候选音频进行音频融合,获得音频融合后的音频。该方法可以提升音频的听觉效果以及用户体验。
技术领域
本申请涉及人工智能终端技术领域,尤其涉及一种音频优化方法、装置、系统及介质。
背景技术
随着观看直播的用户增多,用户对直播质量的要求也越来越高。不仅要求直播画面清晰,还需要收听的声音清晰。由于主播直播现场除了主播声音之外,还会包括现场场景中的声音。假设主播在海边进行直播,海边场景中通常包括海浪声、风声、海鸥鸣叫声、海边的施工声音、海边商店的宣传声等声音。观众听到的直播声音中包括主播的声音还有海边场景中的声音。这些声音中有些是观众想要听到的声音,有些是观众不想听到的噪声。如海边的施工声音、海边商店的宣传声出现在直播声音中,这些观众不想听到的噪声导致主播的声音,海浪声、风声、海鸥鸣叫声不清晰,听觉体验较差。
通过现有的音频优化方法,将海边场景中的声音作为一个整体作为噪声进行降噪处理,实现突出主播的声音的音频优化效果。但是这种处理方式,会将海边场景中的海浪声、风声等也一同被消除,用户无法通过直播的声音感受或者感知到海边场景,也会使用户的听觉体验较差。
发明内容
本申请的目的在于提供一种音频优化方法、装置、系统及介质,以提升音频的听觉效果以及用户体验。
第一方面,本申请提供一种音频优化方法,该方法包括:接收收音群组中的设备发送的候选音频,所述收音群组包括至少一个设备,所述候选音频为目标场景中至少一种声音类型的音频,所述目标场景为所述收音群组中的设备所在的环境对应的场景,每种所述声音类型对应至少一个候选音频;从候选音频集合中,确定每种所述声音类型对应的一个候选音频,并对确定出的候选音频进行音频融合,获得音频融合后的音频,所述候选音频集合包括所述收音群组中的设备发送的候选音频。
在上述技术方案中,收音群组中的设备发送的候选音频为目标场景中至少一种声音类型的音频,从候选音频集合中确定出每种声音类型对应的一个候选音频,并进行音频融合。音频融合后的音频为当前环境的音频,包括了环境对应场景中的至少一种声音类型的声音,使用户通过音频融合后的音频感受或感知环境,提升音频的听觉效果,以及提升用户体验。
一种可能的设计中,目标场景对应的至少一种所述声音类型可以包括人声类型,和/或,环境声音类型。在上述技术方案中,声音类型可以是人声类型,还可以是环境声音类型,可以实现对环境中人声、环境声音的优化,使得音频融合后的音频中的人声、环境声音均可以具有良好的听觉效果。
一种可能的设计中,在所述接收收音群组中的设备发送的候选音频之前还可以确定所述目标场景。在上述技术方案中,通过收音群组中的设备所在的环境对应的场景,可以灵活地对环境中的声音进行音频优化,提升优化效果。
一种可能的设计中,确定所述目标场景过程中,可以首选获取所述环境的关键词;然后根据场景与关键词的对应关系,确定所述环境的关键词对应的场景。在上述技术方案中,根据场景与关键词的对应关系,确定环境的关键词所对应的场景,实现自动化确定收音群组所在环境的场景,提升确定环境对应的场景的效率。
一种可能的设计中,在获取所述环境的关键词时,可以采用如下方式中的至少一种方式获取所述环境的关键词:确定所述环境的关键词;接收所述收音群组中至少一个设备发送的关键词。在上述技术方案中,环境的关键词可以通过确定或者接收的方式获得。若通过确定关键词的方式获得环境的关键词,可以缩短确定环境对应的场景的时间。若通过接收关键词的方式获得环境的关键词,可以减少使用的计算资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011032128.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电池包
- 下一篇:一种富含缺陷的掺氧二硫化钼纳米片析氢电催化剂的制备方法