[发明专利]一种基于自注意力机制的民歌旋律自动生成方法在审
| 申请号: | 202210278243.6 | 申请日: | 2022-03-21 | 
| 公开(公告)号: | CN114664276A | 公开(公告)日: | 2022-06-24 | 
| 发明(设计)人: | 苏玉萍;韩蓉;吴晓军 | 申请(专利权)人: | 陕西师范大学 | 
| 主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/30 | 
| 代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 韩晓娟 | 
| 地址: | 710119 陕西省西安*** | 国省代码: | 陕西;61 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 民歌 旋律 自动 生成 方法 | ||
本发明公开了一种基于自注意力机制的民歌旋律自动生成方法,涉及智能旋律生成技术领域,首先对民歌数据集进行一系列的预处理,转化成适用于网络训练的时间序列;然后依次利用CNN提取旋律局部特征,利用自注意力机制捕捉重点特征以及利用BiGRU提取全局特征等操作,构建融合自注意力机制的CNN‑BiGRU神经网络,并使用预处理得到的数据集训练所搭建的神经网络;最后利用训练好的网络进行民歌旋律的预测生成。本发明的方法在多种评价指标上得到提升,生成的音乐旋律自然优美,且具有生成新颖音乐段落的能力。
技术领域
本发明涉及智能旋律生成技术领域,特别涉及一种基于自注意力机制的民歌旋律自动生成方法。
背景技术
音乐对人类的生活具有重要影响,随着计算机技术和深度学习的不断发展,音乐的自动创作成为当下研究的热点之一。为此,学者们提出了很多相关研究的尝试,其中大部分研究聚焦在自动作曲方面;近年来,随着深度学习技术的不断发展,研究者们也利用相关技术和网络进行音乐生成的研究。但总体来看,由于研究对象本身的复杂性,音乐自动生成仍然是一个充满挑战的任务。
现有的深度学习神经网络作曲主要包括循环神经网络(RNN,Recurrent NeuralNetwork)和长短期记忆神经网络(LSTM,Long and Short Neural Network)。但是基于单一类型神经网络生成的音乐缺乏连续性,主题旋律不突出,开头结尾不自然,生成的效率低下,可听性也比较差。同时,现有的音乐生成领域的研究大多关注古典钢琴曲、爵士乐的生成,对于中国的民歌旋律进行生成的研究还比较少。
因此,如何利用现有的深度学习神经网络,结合不同神经网络的优点,从而生成质量较好的民歌音乐是一个需要解决的迫切问题。
发明内容
本发明的目的在于提供一种基于自注意力机制的民歌旋律自动生成方法,融合卷积神经网络、BiGRU、自注意力机制的优势,基于自注意力机制和CNN-BiGRU网络生成旋律优美的中国民歌旋律。
本发明提供了一种基于自注意力机制的民歌旋律自动生成方法,包括以下步骤:
选取民歌数据集;
将民歌数据集转换为时间序列形式;
利用卷积神经网络CNN提取民歌数据集旋律的局部特征;
利用自注意力机制对卷积神经网络CNN提取的局部特征信息分配相应的权重并进行筛选,
将筛选结果输入BiGRU结构,捕捉局部特征中的重点特征;
根据重点特征构建融合自注意力机制的CNN-BiGRU神经网络;
选取民歌数据集输入CNN-BiGRU神经网络,并在CNN-BiGRU神经网络的功能函数中输入民歌数据集的初始部分seed、生成步数、temperature和最大步数;
CNN-BiGRU神经网络进行旋律预测并生成旋律预测结果。
进一步地,所述旋律预测结果包括旋律编码和MIDI格式的歌曲文件。
进一步地,所述将民歌数据集转换为时间序列形式的步骤,包括:
加载民歌数据集,过滤民歌数据集中全音符到十六分音符范围外的数据;
利用music21库处理加载的民歌数据集,获取每个民歌数据的key并找到民歌数据中的休止符,将歌曲的音调转调为C大调或A小调;
将民歌数据集的音调和休止符转化为时间序列,将民歌数据集转化成为字符串,并保存在文本中;
创建民歌字典并保存在json文件中,将保存的字符串映射转换成int类型的整数,生成训练序列,对训练序列进行one-hot编码序列,转化成适用于CNN-BiGRU神经网络训练的序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210278243.6/2.html,转载请声明来源钻瓜专利网。





