[发明专利]音频检测的方法、设备和存储介质在审
申请号: | 202310553453.6 | 申请日: | 2023-05-16 |
公开(公告)号: | CN116564349A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 李博文 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/45;G10L25/03;G10L25/21;G10L25/18 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 检测 方法 设备 存储 介质 | ||
本公开提供了一种音频检测的方法、设备和存储介质,属于音频技术领域。所述方法包括:对待检测音频进行分帧处理,得到多帧音频信号;对于每帧音频信号,确定所述音频信号在目标频段对应的能量;根据所述音频信号在目标频段对应的能量和所述音频信号之前的N帧音频信号在所述目标频段分别对应的能量,确定所述音频信号的演唱类型,其中,演唱类型为真声演唱或者假声演唱,N为正整数。本公开可以实现对音频信号是真声演唱还是假声演唱的判断。
技术领域
本公开涉及音频技术领域,特别涉及一种音频检测的方法、设备和存储介质。
背景技术
目前,越来越多的人通过终端中安装的音乐应用程序进行K歌、录唱,音乐应用程序可以采集用户演唱的音频,进而,可以对其进行分析,以实现修音、打分等处理。
然而,在进行修音、打分等处理之前,如果无法准确检测出用户是真声演唱还是假声演唱,则修音、打分等处理的效果可能会较差。因此,目前亟需一种能够检测出音频是假声演唱还是真声演唱的方法。
发明内容
本公开提供了一种音频检测的方法、设备和存储介质,能够有效检测出音频是假声演唱还是真声演唱的问题。所述技术方案如下:
第一方面,提供了一种音频处理的方法,所述方法包括:
对待检测音频进行分帧处理,得到多帧音频信号;
对于每帧音频信号,确定所述音频信号在目标频段对应的能量;
根据所述音频信号在目标频段对应的能量和所述音频信号之前的N帧音频信号在所述目标频段分别对应的能量,确定所述音频信号的演唱类型,其中,演唱类型为真声演唱或者假声演唱,N为正整数。
在一种可能的实现方式中,所述确定所述音频信号在目标频段对应的能量,包括:
确定所述音频信号在所述目标频段的各峰值点对应的能量;
计算所述各峰值点对应的能量中除极大值和极小值以外的能量的第一能量均值,作为所音频信号在目标频段对应的能量。
在一种可能的实现方式中,所述根据所述音频信号在目标频段对应的能量和所述音频信号之前的N帧音频信号在所述目标频段分别对应的能量,确定所述音频信号的演唱类型,包括:
确定所述音频信号中的基音的频率和多个泛音的频率;
计算所述多个泛音的频率和所述基音的频率分别对应的能量的第二能量均值;
根据所述音频信号在目标频段对应的能量和所述第二能量均值,计算所述音频信号对应的分贝db值;
根据所述音频信号对应的db值和所述音频信号之前的N帧音频信号分别对应的db值,确定所述音频信号的演唱类型。
在一种可能的实现方式中,所述据所述音频信号对应的db值和所述音频信号之前的N帧音频信号分别对应的db值,确定所述音频信号的演唱类型,包括:
计算所述音频信号之前的N帧音频信号分别对应的db值和所述音频信号对应的db值的第一db值均值;
获取所述前一帧音频信号之前的N帧音频信号分别对应的db值和所述音频信号的前一帧音频信号对应的db值的第二db值均值;
根据所述第一db值均值和所述第二db值均值,确定所述音频信号的演唱类型。
在一种可能的实现方式中,所述根据所述第一db值均值和所述第二db值均值,确定所述音频信号的演唱类型,包括:
将所述第一db值均值减去所述第二db值均值,得到第一差值;
如果所述第一差值小于0,且所述第一差值的绝对值大于第一参考阈值,则确定所述音频信号为假声演唱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310553453.6/2.html,转载请声明来源钻瓜专利网。