[发明专利]基于神经网络的佛教音乐记谱方法、装置、设备及介质在审
申请号: | 202110308570.7 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113112969A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 刘奡智;韩宝强;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10G3/04 | 分类号: | G10G3/04;G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 佛教 音乐 记谱 方法 装置 设备 介质 | ||
本发明用于人工智能领域,涉及区块链领域,公开了一种基于神经网络的佛教音乐记谱方法、装置、设备及介质,其中方法部分包括:获取需要转为乐谱的原始佛教音频数据,并转换为时频谱矩阵,获取包括音高识别模型的音高识别网络结构,获取包括唱词识别模型的唱词识别网络结构,将时频谱矩阵分别输入音高识别网络结构、唱词识别网络结构,以获得原始佛教音频数据的音高识别数据和唱词识别数据,根据音高识别数据与唱词识别数据生成原始佛教音频数据的简谱;本发明利用迁移学习技术,以预训练的音高识别模型和语音转文字模型作为基础,能自动识别出佛教音频的旋律和唱词以获得简谱,降低了佛教音乐记谱的时间成本,提高了佛教音乐记谱的效率。
技术领域
本发明涉及人工智能领域,尤其涉及一种基于神经网络的佛教音乐记谱方法、装置、设备及介质。
背景技术
佛教音乐的采风和记谱工作对佛教文化的保留和传承有着重要意义。由于佛教音乐用词的特殊性和音乐学上的特征,目前在流行音乐和西方古典乐领域内有一些被实用化的自动记谱系统,在对佛教音乐进行识别记谱时,准确率较低,导致自动记谱系统的难以被应用于佛教音乐领域中。
因此,在采风获得佛教音乐之后,对佛教音乐的记谱主要依靠人工完成,人工记谱的过程重复工作较多,且记谱人员需要较为具有较高的佛学知识水平和音乐水平。一位熟练掌握音乐知识和佛教相关文化的学者,往往要花几个月的时间才能完成一两百张乐谱的记录,耗费大量的精力和时间,记谱成本较高、记谱效率低。
发明内容
本发明提供一种基于神经网络的佛教音乐记谱方法、装置、设备及介质,以解决现有技术中,佛教音乐的记谱工作依赖于人工记谱,导致记谱成本较高、记谱效率低的问题。
一种基于神经网络的佛教音乐记谱方法,包括:
获取需要转为乐谱的原始佛教音频数据,并将所述原始佛教音频数据转换为时频谱矩阵,所述原始佛教音频数据包括佛教音频的音乐旋律和唱词;
获取包括音高识别模型的音高识别网络结构,所述音高识别模型为将预训练的声音场景分类模型进行迁移学习后形成的神经网络识别模型;
获取包括唱词识别模型的唱词识别网络结构,所述唱词识别模型为将预训练的语音转文字模型迁移学习后形成的神经网络识别模型;
将所述时频谱矩阵输入所述音高识别网络结构,获得所述原始佛教音频数据的音高识别数据;
将所述时频谱矩阵输入所述唱词识别网络结构,获得所述原始佛教音频数据的唱词识别数据;
根据所述音高识别数据与所述唱词识别数据生成所述原始佛教音频数据的简谱。
进一步地,所述根据所述音高识别数据与所述唱词识别数据生成所述原始佛教音频数据的简谱,包括:
确定所述音高识别数据中每一帧的音高,并确定所述唱词识别数据中每一帧的唱词;
将每一帧的所述音高与所述唱词进行对应连接,获得所述原始佛教音频数据的初始数据;
采用节拍器对所述初始数据进行节拍量化,以生成所述初始数据的简谱。
进一步地,所述根据所述音高识别数据与所述唱词识别数据生成所述原始佛教音频数据的简谱之后,所述方法还包括:
将所述简谱的格式转换为MusicXML格式;
获取所述佛教音乐专家对所述MusicXML格式的简谱的人工校对结果;
根据所述人工校对结果更新所述简谱。
进一步地,所述将所述原始佛教音频数据转换为时频谱矩阵,包括:
确定对所述原始佛教音频数据进行转换的窗函数为汉宁窗函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110308570.7/2.html,转载请声明来源钻瓜专利网。