[发明专利]一种基于自注意力机制的民歌旋律自动生成方法在审
| 申请号: | 202210278243.6 | 申请日: | 2022-03-21 | 
| 公开(公告)号: | CN114664276A | 公开(公告)日: | 2022-06-24 | 
| 发明(设计)人: | 苏玉萍;韩蓉;吴晓军 | 申请(专利权)人: | 陕西师范大学 | 
| 主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/30 | 
| 代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 韩晓娟 | 
| 地址: | 710119 陕西省西安*** | 国省代码: | 陕西;61 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 民歌 旋律 自动 生成 方法 | ||
1.一种基于自注意力机制的民歌旋律自动生成方法,其特征在于,包括以下步骤:
选取民歌数据集;
将民歌数据集转换为时间序列形式;
利用卷积神经网络CNN提取民歌数据集的局部特征;
利用自注意力机制对卷积神经网络CNN提取的局部特征信息分配相应的权重并进行筛选;
将筛选结果输入BiGRU结构,捕捉局部特征中的重点特征;
根据重点特征构建融合自注意力机制的CNN-BiGRU神经网络;
选取民歌数据集输入CNN-BiGRU神经网络,并在CNN-BiGRU神经网络的功能函数中输入民歌数据集的初始部分seed、生成步数、temperature和最大步数;
CNN-BiGRU神经网络进行旋律预测并生成旋律预测结果。
2.如权利要求1所述的一种基于自注意力机制的民歌旋律自动生成方法,其特征在于,所述旋律预测结果包括旋律编码和MIDI格式的歌曲文件。
3.如权利要求1所述的一种基于自注意力机制的民歌旋律自动生成方法,其特征在于,所述将民歌数据集转换为时间序列形式的步骤,包括:
加载民歌数据集,过滤民歌数据集中全音符到十六分音符范围外的数据;
利用music21库处理加载的民歌数据集,获取每个民歌数据的key并找到民歌数据中的休止符,将歌曲的音调转调为C大调或A小调;
将民歌数据集的音调和休止符转化为时间序列,将民歌数据集转化成为字符串,并保存在文本中;
创建民歌字典并保存在json文件中,将保存的字符串映射转换成int类型的整数,生成训练序列,对训练序列进行one-hot编码序列,转化成适用于CNN-BiGRU神经网络训练的序列。
4.如权利要求1所述的一种基于自注意力机制的民歌旋律自动生成方法,其特征在于,所述BiGRU结构的构成函数为:
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
yt=σ(Wo·ht)
其中:Zt表示t时刻的更新门,rt表示t时刻的重置门,ht表示t时刻的激活状态,ht-1表示t-1时刻的隐层状态,xt表示t时刻的输入,σ表示激活函数,Wr、Wz、Wh、Wo均表示学习的权重参数。
5.如权利要求1所述的一种基于自注意力机制的民歌旋律自动生成方法,其特征在于,所述利用自注意力机制对卷积神经网络CNN提取的特征信息分配相应的权重并进行筛选的步骤,包括:
自注意力机制获取卷积神经网络CNN提取的特征信息;
自注意力机制的Self-Attention层计算特征信息的注意力权重,向量的维度设置为32,使用的激活函数为softmax;
其中,自注意力机制的计算公式如下:
其中,Attention(Q,K,V)表示自注意力的值,Q、K、V分别代表查询向量矩阵、键向量矩阵和值向量矩阵。
6.如权利要求1所述的一种基于自注意力机制的民歌旋律自动生成方法,其特征在于,还包括:
使用均方误差MSE评价CNN-BiGRU神经网络的优劣;
使用交叉熵损失函数loss值对CNN-BiGRU神经网络进行误差计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210278243.6/1.html,转载请声明来源钻瓜专利网。





