[发明专利]一种基于PSO-BP神经网络的民族乐器识别方法在审
申请号: | 202210957626.6 | 申请日: | 2022-08-10 |
公开(公告)号: | CN115295010A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 李峰;王玲玲 | 申请(专利权)人: | 安徽财经大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G06K9/62;G06N3/04;G06N3/08;G06N3/00 |
代理公司: | 北京市浩东律师事务所 11499 | 代理人: | 孙莉 |
地址: | 233030 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 pso bp 神经网络 民族乐器 识别 方法 | ||
本发明适用于音频处理技术领域,尤其涉及一种基于PSO‑BP神经网络的民族乐器识别方法及系统,所述方法包括:输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC;利用提取得到的标准梅尔倒谱参数特征MFCC对PSO‑BP神经网络分类模型进行训练;将需要识别的民族乐器音频输入经过训练的PSO‑BP神经网络分类模型,得到识别结果。本发明创建了pso‑bp神经网络的分类系统,使用建立的中国乐器特征的训练集对pso‑bp神经网络进行学习训练,训练后得到训练好的pso‑bp神经网络分类模型,使用分类模型对测试集进行识别和分类测试。总体实验结果表现很好,识别率均超过99%,平均分类准确率为99.78%,超过了现行算法,本发明具有较高的准确性与实用性。
技术领域
本发明属于音频处理技术领域,尤其涉及一种基于PSO-BP神经网络的民族乐器识别方法。
背景技术
中国传统民族乐器的识别与分类,不仅有助于我们研究其巨大的科学研究价值,而且可以让世界更多的人能够了解中国民族乐器。近年来,国内不少的研究学者对中国民族乐器识别分类问题也进行了深入的研究,期望实现中国民族乐器准确的识别与分类。
现有技术中提出了基于lvq的神经网络分类算法,具有构造简单、输入矢量不必根据需要而进行归一化、正交换等长处。现有技术中还提出了隐马尔可夫分类算法,这种模型可以根据数据库大量信息的进行学习,推测出当某一个音或某几个音出现时接下来出现各个音的可能性,产生新的音乐。
但是现有技术中,面对高维问题也会有过早的收敛的问题,而且算法局部搜索能力比较差,搜索精度还不够高。
发明内容
本发明实施例的目的在于提供一种基于PSO-BP神经网络的民族乐器识别方法,旨在解决面对高维问题也会有过早的收敛的问题,而且算法局部搜索能力比较差,搜索精度还不够高的问题。
本发明实施例是这样实现的,一种基于PSO-BP神经网络的民族乐器识别方法,所述方法包括:
输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC;
利用提取得到的标准梅尔倒谱参数特征MFCC对PSO-BP神经网络分类模型进行训练;
将需要识别的民族乐器音频输入经过训练的PSO-BP神经网络分类模型,得到识别结果。
优选的,构建所述PSO-BP神经网络分类模型的步骤,具体包括:
初始步优化与特定粒子群结构的参数,所述参数包括粒子群在集群的元素个数、最大迭代的发生次数、粒子的位置和速度;
通过适应度函数来评估和计算各种粒子适应度值,并进行评价;
根据粒子适应度值分别对Pbest和Gbest进行更新,根据速率公式更新整个粒子群的中心位置和移动速度,判断是否满足输出条件,若满足条件则输出结果,否则返回上一步骤;
将经过改进pso算法进行计算优化后的最优权值和阈数值分别传递给具有bp的神经网络分类模型,输入训练集,进行逻辑学习与计算训练,训练完成后得到pso-bp神经网络分类模型。
优选的,所述输出条件为迭代次数达到限定次数或者获得最佳适应度值。
优选的,改进pso算法中采用线性向量递减算法惯性向量权重算法,公式如下:
ω(k)=ωstart-(ωstart-ωend)(Tmax-k)/Tmax,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽财经大学,未经安徽财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210957626.6/2.html,转载请声明来源钻瓜专利网。