[发明专利]啸叫检测方法及装置、存储介质、电子设备有效
申请号: | 202110529806.X | 申请日: | 2021-05-14 |
公开(公告)号: | CN113271386B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 宋钦梅;阮良;陈功;陈丽;陈耀斌 | 申请(专利权)人: | 杭州网易智企科技有限公司 |
主分类号: | H04M9/08 | 分类号: | H04M9/08;G10L25/78;G10L25/51 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 方法 装置 存储 介质 电子设备 | ||
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及啸叫检测方法及装置,存储介质和电子设备。所述啸叫检测方法包括:获取当前输入的音频信号并对其进行变换以获取所述音频信号对应的频域信号;识别所述频域信号中的峰值点,根据全部的所述峰值点计算平均能量值,并筛选最大峰值点;计算所述最大峰值点与所述平均能量值之间的第一比值,并将第一比值与预设的第一阈值进行比对,以根据比对结果确定所述音频信号的啸叫检测结果。本公开通过利用频域信号中的峰值信息进行啸叫检测,能够有效的提升啸叫检测的准确率,尤其针对音乐场景,可以有效的减少误判和漏判。
技术领域
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及啸叫检测方法及装置,存储介质和电子设备。
背景技术
本部分旨在为权利要求中陈述的本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。
在多媒体通信领域,在电话会议或者多媒体会议等应用场景中,由于参会人数众多,极易出现由于硬件设备问题或者是场景问题导致的啸叫现象,从而导致严重降低通话质量;因此啸叫处理是音频处理中的一个重要环节。通过啸叫处理以避免在通话过程中出现啸叫现象,可极大的提升通话语音质量和参会人的主观体验。
在一些技术中,存在使用基于机器学习的算法进行啸叫检测,一类是基于传统信号处理,基于不同形式的功率/功率比的方式进行啸叫检测;但存在检测准确率不稳定的问题,例如音乐场景下会存在过多误判。另一类是基于AI机器训练进行啸叫检测;但由于该类算法基于AI模型,存在计算量较高的问题,且对设备的CPU占用较高。
发明内容
在本上下文中,本公开的实施方式期望提供一种啸叫检测方法和装置、存储介质和电子设备。
根据本公开的一个方面,提供一种啸叫检测方法,包括:
获取当前输入的音频信号并对其进行变换以获取所述音频信号对应的频域信号;
识别所述频域信号中的峰值点,根据全部的所述峰值点计算平均能量值,并筛选最大峰值点;
计算所述最大峰值点与所述平均能量值之间的第一比值,并将第一比值与预设的第一阈值进行比对,以根据比对结果确定所述音频信号的啸叫检测结果。
在本公开的一种示例性实施例中,所述第一比值为所述最大峰值相比于所述平均能量值的结果;
所述将第一比值与预设的第一阈值进行比对时,所述方法还包括,在第一比值大于所述第一阈值时:
基于所述频域信号对应的高频能量参数和低频能量参数确定对应的场景标记;以及
获取所述频域信号对应的相关周期性参数、谐波特性参数和端点检测结果;
根据所述相关周期性参数、谐波特性参数和端点检测结果结合所述场景标记确定所述频域信号对应的瞬时啸叫概率,以用于根据所述瞬时啸叫概率判断所述音频信号是否存在啸叫。
在本公开的一种示例性实施例中,所述确定所述频域信号对应的瞬时啸叫概率后,所述方法还包括:
基于前序预设时长的音频信号对应的啸叫检测结果对所述瞬时啸叫概率进行修正;
根据修正后的所述瞬时啸叫概率确定所述啸叫检测结果。
在本公开的一种示例性实施例中,所述将所述瞬时啸叫概率,结合前序预设时长的音频信号对应的啸叫检测结果,对所述瞬时啸叫概率进行修正,包括:
将所述瞬时啸叫概率加入长时啸叫检测数据队列;所述长时啸叫检测数据队列包括以当前的所述音频数据为终点的预设时长的连续音频信号对应的历史啸叫概率值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易智企科技有限公司,未经杭州网易智企科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110529806.X/2.html,转载请声明来源钻瓜专利网。