[发明专利]一种基于频谱增强和卷积宽度学习的音乐流派分类方法在审

专利信息
申请号: 202211583334.7 申请日: 2022-12-09
公开(公告)号: CN115985339A 公开(公告)日: 2023-04-18
发明(设计)人: 刘万军;李雨萌;曲海成 申请(专利权)人: 辽宁工程技术大学
主分类号: G10L25/24 分类号: G10L25/24;G10L15/08;G10L15/06;G10L15/16
代理公司: 北京华夏正合知识产权代理事务所(普通合伙) 11017 代理人: 韩登营
地址: 123000 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 频谱 增强 卷积 宽度 学习 音乐 流派 分类 方法
【说明书】:

发明公开了一种基于频谱增强和卷积宽度学习的音乐流派分类方法,包括:将GTZAN数据集的音乐数据转化为梅尔频谱,并用SpecAugment中屏蔽频率信道的方法增强梅尔频谱的多样性;将增强后的梅尔频谱切割成频谱切片,防止冗余计算并扩大数据集的规模;将切割后的频谱切片按8:2划分训练集和测试集;将数据集输入卷积宽度学习;训练模型;测试模型;输出训练时间和分类准确率。本发明的基于频谱增强和卷积宽度学习的音乐流派分类方法能够有效地将卷积模块整合到现有宽度学习架构中,为网络模型带来明显的性能增益,进而提升音乐流派分类的工作效率。

技术领域

本发明属于音乐流派分类的技术领域,尤其涉及一种基于频谱增强和卷积宽度学习的音乐流派分类方法。

背景技术

音乐流派分类已成为目前的研究热点,随着数字音乐媒体平台的发展,在线音乐成为大众的音乐消费主体,海量的音乐数据引发用户音乐检索、歌单分类、喜好推荐等个性化需求。而这些个性化需求离不开对音乐流派的分类。高效且精确地对音乐流派进行智能分类对音乐平台的发展有着重大意义,也是音乐信息检索领域亟待解决的难题。

由于深度模型带有复杂的超参数和隐藏层,使得音乐流派分类模型训练耗时,而且随着训练的迭代容易出现过拟合问题,且当训练数据出现增量时无法得到更好的扩展,训练时间也随着深度的加深而延长,因此常用的机器学习音乐流派识别模型在处理大量的训练样本时表现较差。

频谱图是通过傅里叶变换(fast fourier transform,FFT)得到的可视化表达,是处理语音信号的关键特征。由于音频信号在时域范围内是不稳定的,为了假定音频信号的稳定性,要先对音乐原始的音频信号进行分帧、加窗的操作,并将傅立叶变换应用于每一个信号窗,使得每个信号窗都有一个与之关联的频率分量,将音乐信号的时间作为横轴,音乐的频率作为纵轴,就绘制出了一张能直观表达频率分量在时间上分布情况的二维图像,随着音乐流派分类领域对特征提取的要求提高,对于不同流派间差异性区分较弱的频谱图已经不能满足音乐流派分类对特征挖掘的要求,能增强音乐节奏性和细节表达的梅尔频谱逐渐走进音乐流派分类领域。频谱图与原始频谱图的区别在于梅尔频谱图将经过快速傅里叶变换后的音频信号通过梅尔滤波器组,提取每个信号窗的梅尔频谱分量,最后将所有的梅尔频谱分量拼接成此音频信号的梅尔频谱图。

随着训练的次数增多和网络的加深容易在训练网络时学习到不需要的细节和噪声,导致模型过拟合。

深度学习是近年来音乐流派分类的主流方法,由于深度卷积神经网络(DCNN)具有权值共享和较好的局部感知特性,对音乐数据频谱图象中音乐流派特征和节奏频率等要素的局部微弱变化感知能力较强,由此成为了实现音乐流派分类的一种常用模型,常用的深度卷积神经网络有Alexnet、VGGnet、GoogLeNet等。

由于深度模型带有复杂的超参数和隐藏层,使得音乐流派分类模型训练耗时,而且随着训练的迭代容易出现过拟合问题,且当训练数据出现增量时无法得到更好的扩展,训练时间也随着深度的加深而变长,因此常用的机器学习音乐流派识别模型在处理大量的训练样本时表现较差。

发明内容

基于以上现有技术的不足,本发明所解决的技术问题在于提供一种基于频谱增强和卷积宽度学习的音乐流派分类方法,有效地将卷积模块整合到现有宽度学习架构中,为网络模型带来明显的性能增益,进而提升音乐流派分类的工作效率。

为了解决上述技术问题,本发明通过以下技术方案来实现:本发明提供一种基于频谱增强和卷积宽度学习的音乐流派分类方法,包括:

步骤S1、将GTZAN数据集的音乐数据转化为梅尔频谱,并用SpecAugment中屏蔽频率信道的方法增强梅尔频谱的多样性;

步骤S2、将增强后的梅尔频谱切割成频谱切片,防止冗余计算并扩大数据集的规模;

步骤S3、将切割后的频谱切片按8:2划分训练集和测试集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211583334.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top