[发明专利]一种架子鼓乐谱识别方法及装置在审
申请号: | 202210730185.6 | 申请日: | 2022-06-24 |
公开(公告)号: | CN115146649A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 姚俊峰;及宇轩;许梅燕 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/279;G06F40/151;G06N3/04;G06N3/08 |
代理公司: | 厦门市新华专利商标代理有限公司 35203 | 代理人: | 朱凌 |
地址: | 361000 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 架子鼓 乐谱 识别 方法 装置 | ||
1.一种架子鼓乐谱识别方法,其特征在于,包括:
步骤10、将一行架子鼓乐谱转化为架子鼓乐谱文本序列以及与所述文本序列一一对应的图片文件;对大量架子鼓乐谱进行处理,获得架子鼓乐谱数据集;
步骤20、生成架子鼓乐谱语义字典,所述语义字典包括架子鼓乐谱文本序列中所有可能出现的语义项,用于语义项与数字序列之间的相互转换;
步骤30、进行架子鼓乐谱识别模型训练,通过所述语义字典将所述数据集中的架子鼓乐谱文本序列转化为乐谱数字序列,再将该数字序列转换为标准的二维变量并用指定符号对没有弹奏的音进行填充,然后将架子鼓乐谱文本序列以及它对应的架子鼓乐谱图片作为卷积循环神经网络模型的输入,将对应的二维变量作为模型的输出,对模型进行训练直至完成;
步骤40、将待识别的架子鼓乐谱图片输入训练好的模型,得到对应的二维变量,将该二维变量中的指定符号删除转化为数字序列,再通过所述语义字典转化为架子鼓乐谱文本序列。
2.根据权利要求1所述的方法,其特征在于:所述步骤10具体包括:
步骤11、将.mxl转换成.musicxml文件,具体通过在MuseScore中使用插件-BatchConvert Resize Height进行转换;
步骤12、运行removecredits.py文件,处理.musicxml文件,消除信用性文本,从而对.musicxml文件进行清理;
步骤13、将清理后的.musicxml文件转换成.mscz文件,具体通过在MuseScore中使用“插件-Batch Convert Orig”进行转换;
步骤14、将.mscz文件转化成.musicxml和.png文件,具体通过在MuseScore中使用“插件-Batch Convert Orig”进行转换,所述.png文件即与所述文本序列一一对应的图片文件;
步骤15、用genlabels.py文件将.musicxml文件转换成.semantic文件,所述.semantic文件即架子鼓乐谱文本序列。
3.一种架子鼓乐谱识别装置,其特征在于,包括:数据集生成模块、语义字典模块、训练模块以及识别模块;
所述数据集生成模块,用于将一行架子鼓乐谱转化为架子鼓乐谱文本序列以及与所述文本序列一一对应的图片文件;对大量架子鼓乐谱进行处理,获得架子鼓乐谱数据集;
所述语义字典模块,用于生成架子鼓乐谱语义字典,所述语义字典包括架子鼓乐谱文本序列中所有可能出现的语义项,用于语义项与数字序列之间的相互转换;
所述训练模块,用于进行架子鼓乐谱识别模型训练,通过所述语义字典将所述数据集中的架子鼓乐谱文本序列转化为乐谱数字序列,再将该数字序列转换为标准的二维变量并用指定符号对没有弹奏的音进行填充,然后将架子鼓乐谱文本序列以及它对应的架子鼓乐谱图片作为卷积循环神经网络模型的输入,将对应的二维变量作为模型的输出,对模型进行训练直至完成;
所述识别模块,用于将待识别的架子鼓乐谱图片输入训练好的模型,得到对应的二维变量,将该二维变量中的指定符号删除转化为数字序列,再通过所述语义字典转化为架子鼓乐谱文本序列。
4.根据权利要求3所述的装置,其特征在于:所述步骤数据集生成模块具体用于执行如下步骤:
步骤11、将.mxl转换成.musicxml文件,具体通过在MuseScore中使用插件-BatchConvertResize Height进行转换;
步骤12、运行removecredits.py文件,处理.musicxml文件,消除信用性文本,从而对.musicxml文件进行清理;
步骤13、将清理后的.musicxml文件转换成.mscz文件,具体通过在MuseScore中使用“插件-Batch Convert Orig”进行转换;
步骤14、将.mscz文件转化成.musicxml和.png文件,具体通过在MuseScore中使用“插件-Batch Convert Orig”进行转换,所述.png文件即与所述文本序列一一对应的图片文件;
步骤15、用genlabels.py文件将.musicxml文件转换成.semantic文件,所述.semantic文件即架子鼓乐谱文本序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210730185.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:涤纶深染织物的制备方法及涤纶深染母粒
- 下一篇:一种擦拭无纺布及其制造方法