[发明专利]歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质有效
申请号: | 201911138249.8 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110853677B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 宋冬梅;武剑;王宏 | 申请(专利权)人: | 北京雷石天地电子技术有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/27 |
代理公司: | 深圳壹舟知识产权代理事务所(普通合伙) 44331 | 代理人: | 寇闯 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 歌曲 鼓声 节拍 识别 方法 装置 终端 临时性 计算机 可读 存储 介质 | ||
本发明涉及语音信号处理领域,提供了歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质,以实现对歌曲中各种频率的鼓声节拍准确识别的技术效果。该方法包括:对待识别鼓声节拍的音频数据进行归一化处理,得到归一化音频数据;在频域上分析归一化音频数据的高频段特征,提取归一化音频数据的高频节拍序列;在时域上分析归一化音频数据的低频段特征,提取归一化音频数据的低频节拍序列;当对高频节拍序列和低频节拍序列进行整合时,若在高频节拍序列中存在节拍BH与低频节拍序列中存在节拍BL且节拍BH与节拍BL之间的间隔小于最小节拍间隔时间,则只保留高频节拍序列的节拍BH。本发明的技术方案能对鼓声节拍进行准确识别。
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质。
背景技术
对歌曲中鼓声节拍的识别可分析出打击乐器所产生的节拍信息,一般用于KTV中的歌曲与灯光的配合效果即声光同步,亦可用于音乐喷泉,以节拍的快慢控制音乐喷泉中灯光闪烁处理等。
现有的鼓声节拍识别方法包括时域的鼓声节拍识别方法或频域的鼓声节拍识别方法,其中,时域的鼓声节拍识别方法针对低频打击乐有一定的识别效果,对高频打击乐器识别效果较差,几乎无法识别,并且不同的歌曲由于平均能量不同,识别的准确度差异较大,而频域的鼓声节拍识别方法对高频打击乐器的识别效果明显不如对低频打击乐器的识别效果,对幅度较小的打击声、高频打击声的幅度或相位变化易处在判定的阀值附近,导致识别准确度明显降低。
综上,现有的鼓声节拍识别方法仍然各有其对鼓声节拍识别准确度低的缺陷。
发明内容
本发明提供一种歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质,实现对歌曲中各种频率的鼓声节拍准确识别的技术效果。
一方面,本发明提供了一种歌曲的鼓声节拍识别方法,包括:
对待识别鼓声节拍的音频数据进行归一化处理,得到归一化音频数据;
在频域上分析归一化音频数据的高频段特征,提取归一化音频数据的高频节拍序列;
在时域上分析归一化音频数据的低频段特征,提取归一化音频数据的低频节拍序列;
当对高频节拍序列和低频节拍序列进行整合时,若在高频节拍序列中存在节拍BH与低频节拍序列中存在节拍BL且节拍BH与节拍BL之间的间隔小于最小节拍间隔时间,则只保留高频节拍序列的节拍BH。
具体地,在频域上分析归一化音频数据的高频段特征,提取归一化音频数据的高频节拍序列,包括:
采用滑动窗分帧法对归一化音频数据分帧;
通过傅里叶变换,获取每一帧归一化音频数据高频部分的有效频点数据范围;
采用幅度差法或相位差法计算归一化音频数据高频部分的有效频点数据范围内归一化音频数据的高频节拍序列。
具体地,采用幅度差法或相位差法计算归一化音频数据高频部分的有效频点数据范围内归一化音频数据的高频节拍序列,包括:
求取归一化音频数据高频部分相邻分帧之间所有相应频点正的幅度差值之和fftdivsum(n)或相位差绝对值之和phasedivsum(n),其中,n表示数据分帧时的帧序号;
根据归一化音频数据高频部分相邻分帧之间所有相应频点正的幅度差值之和fftdivsum(n)或相位差绝对值之和phasedivsum(n),计算fftdivsum(n)的滑动平均值曲线Avg(n)或phasedivsum(n)的平均值PAVGSum;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雷石天地电子技术有限公司,未经北京雷石天地电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911138249.8/2.html,转载请声明来源钻瓜专利网。