[发明专利]一种基于PSO-BP神经网络的民族乐器识别方法在审
申请号: | 202210957626.6 | 申请日: | 2022-08-10 |
公开(公告)号: | CN115295010A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 李峰;王玲玲 | 申请(专利权)人: | 安徽财经大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G06K9/62;G06N3/04;G06N3/08;G06N3/00 |
代理公司: | 北京市浩东律师事务所 11499 | 代理人: | 孙莉 |
地址: | 233030 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 pso bp 神经网络 民族乐器 识别 方法 | ||
1.一种基于PSO-BP神经网络的民族乐器识别方法,其特征在于,所述方法包括:
输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC;
利用提取得到的标准梅尔倒谱参数特征MFCC对PSO-BP神经网络分类模型进行训练;
将需要识别的民族乐器音频输入经过训练的PSO-BP神经网络分类模型,得到识别结果。
2.根据权利要求1所述的基于PSO-BP神经网络的民族乐器识别方法,其特征在于,构建所述PSO-BP神经网络分类模型的步骤,具体包括:
初始步优化与特定粒子群结构的参数,所述参数包括粒子群在集群的元素个数、最大迭代的发生次数、粒子的位置和速度;
通过适应度函数来评估和计算各种粒子适应度值,并进行评价;
根据粒子适应度值分别对Pbest和Gbest进行更新,根据速率公式更新整个粒子群的中心位置和移动速度,判断是否满足输出条件,若满足条件则输出结果,否则返回上一步骤;
将经过改进pso算法进行计算优化后的最优权值和阈数值分别传递给具有bp的神经网络分类模型,输入训练集,进行逻辑学习与计算训练,训练完成后得到pso-bp神经网络分类模型。
3.根据权利要求2所述的基于PSO-BP神经网络的民族乐器识别方法,其特征在于,所述输出条件为迭代次数达到限定次数或者获得最佳适应度值。
4.根据权利要求2所述的基于PSO-BP神经网络的民族乐器识别方法,其特征在于,改进pso算法中采用线性向量递减算法惯性向量权重算法,公式如下:
ω(k)=ωstart-(ωstart-ωend)(Tmax-k)/Tmax,
其中,ωstart为初始惯性权重,ωend为迭代至最大次数时的惯性权重,k为当前迭代代数,Tmax为最大迭代代数情况下,惯性权值取值为ωstart=0.9,ωend=0.4。
5.根据权利要求1所述的基于PSO-BP神经网络的民族乐器识别方法,其特征在于,输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC的步骤,具体包括:
输入数据源,通过高通滤波器进行预加重处理,所述高通滤波器为:
H(Z)=1-μz-1,式中μ为0.98;
对数据点进行分帧,1024点被划分为一帧,
加上汉明窗,对每一帧数据点进行fft变换,将所有的能量谱经由一组12个mel尺度的三角形滤波器组,mel滤波器组的公式如下:
式中,
经过离散余弦变换后,得到标准梅尔倒谱参数特征MFCC。
6.根据权利要求1所述的基于PSO-BP神经网络的民族乐器识别方法,其特征在于,提取标准梅尔倒谱参数特征MFCC时,同时提取相应的一阶差分计算参数和二阶差分计算参数,则MFCC的全部差分计算参数是由12维MFCC系数+12维一阶差分计算参数+12维二阶差分计算参数组成的36维MFCC差分计算参数。
7.根据权利要求6所述的基于PSO-BP神经网络的民族乐器识别方法,其特征在于,差分计算参数的计算采用如下公式:
式中,θm表示第m个一阶差分计算参数,Cm表示第m个梅尔倒谱系数,Q表示梅尔倒谱系数的阶数,K表示一阶导数的时间差,将上式的结果再代入得到二阶差分计算参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽财经大学,未经安徽财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210957626.6/1.html,转载请声明来源钻瓜专利网。