[发明专利]一种基于多层感知机的音乐情感预测方法在审
申请号: | 202310551904.2 | 申请日: | 2023-05-16 |
公开(公告)号: | CN116597865A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 苏玉萍;陈婕;张玉梅;朱昀 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L25/03;G06N3/045;G06N3/048;G06N3/084;G06N3/09 |
代理公司: | 陕西铭一知识产权代理有限公司 61287 | 代理人: | 何春兰 |
地址: | 710000 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 感知 音乐 情感 预测 方法 | ||
1.一种基于多层感知机的音乐情感预测方法,其特征在于,包括步骤:
获取音乐情感数据;
利用三元组神经网络对所述音乐情感数据中的原始音频特征进行降维,获得音乐情感数据中的高阶音频特征;
将音乐情感数据中的高阶音频特征输入多层感知机MLP网络中,经过前向传播,得到输出的情感值;
计算输出的情感值和真实情感值的总误差,并基于所述总误差利用反向传播算法的监督学习法对多层感知机MLP网络进行训练;
将待预测的音乐情感数据输入训练好的多层感知机MLP网络中进行音乐情感预测,获得音乐情感的预测valence-arousal值。
2.如权利要求1所述的一种基于多层感知机的音乐情感预测方法,其特征在于,在所述利用三元组神经网络对所述音乐情感数据中的原始音频特征进行降维之前,需对所述音乐情感数据进行预处理,所述预处理包括如下步骤:
加载音乐情感数据集,去除数据集中音频缺失的特征信息,形成特征数据文件、valence值文件和arousal值文件。
3.如权利要求1所述的一种基于多层感知机的音乐情感预测方法,其特征在于,所述利用三元组神经网络对所述音乐情感数据中的原始音频特征进行降维,具体包括如下步骤:
构建若干对三元组;
将构建的若干对三元组输入三元组神经网络,根据三元组损失函数值来训练网络模型,将高维的音频序列降为低维的音频序列,获得高阶音频特征;
所述三元组损失函数表达式如下:
L(anchor,positive,negative)=max(D(anchor,positive)-D(anchor,negative)+α,0)其中,D(anchor,positive)表示锚向量anchor和正向量positive之间的欧氏距离的平方;D(anchor,negative)表示锚向量anchor和负向量negative之间的欧氏距离的平方;α是一个边缘参数,它指定了正例子和负例子应该分开的距离。
4.如权利要求3所述的一种基于多层感知机的音乐情感预测方法,其特征在于,所述构建若干对三元组,包括如下步骤:
从音乐情感数据中随机选择一个样本作为锚向量anchor,它的标签值记为yvA;
从音乐情感数据中的样本中随机选择一个样本,判断所述样本与anchor是否为相同类别,是则作为正向量positive,否则作为负向量negative。
5.如权利要求4所述的一种基于多层感知机的音乐情感预测方法,其特征在于,所述判断所述样本与anchor是否为相同类别,具体包括如下步骤:
当yvX∈[yvA-ΔP,yvA+ΔP]时,yvX属于与anchor相同类别的样本,即positive;
当yvX∈(-∞,yvA-ΔN]∨[yvA+ΔN,∞)时,yvX属于与anchor不同类别的样本,即negative。
6.如权利要求3所述的一种基于多层感知机的音乐情感预测方法,其特征在于,在对音频特征进行降维时,还通过包含一个隐藏层的浅层神经网络构建三元组基函数,并使用ReLU激活函数及Adam优化器优化浅层神经网络,通过训练集对构建的每一个浅层神经网络进行训练。
7.如权利要求6所述的一种基于多层感知机的音乐情感预测方法,其特征在于,所述ReLU函数的计算公式为:
ReLU(x)=max(x,0)
其中,x为上一层神经网络的输入向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310551904.2/1.html,转载请声明来源钻瓜专利网。