[发明专利]音乐识别方法、音乐识别装置、电子设备及存储介质在审
申请号: | 202310574540.X | 申请日: | 2023-05-19 |
公开(公告)号: | CN116645974A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 张旭龙;王健宗;程宁;赵嘉豪 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L15/18;G10L25/63;G10L25/30;G10L15/16;G10L19/00;G10L25/51 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 廖慧贤 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种音乐识别方法、音乐识别装置、电子设备及存储介质,属于人工智能技术领域。方法包括:获取音乐数据,音乐数据包括目标音乐的音频数据和歌词文本数据;对音频数据进行特征提取,得到目标音乐音频特征,目标音乐音频特征包含目标音乐的韵律特点;对歌词文本数据进行上下文提取,得到目标音乐歌词特征,目标音乐歌词特征包含目标音乐的文本内容特点;对目标音乐音频特征和目标音乐歌词特征进行特征拼接,得到目标音乐表征特征;基于候选音乐流派标签对目标音乐表征特征进行流派识别,得到目标音乐的目标流派类别;基于候选音乐情感标签对目标音乐表征特征进行情感识别,得到目标音乐的目标情感类别。本申请能提高音乐识别的准确性。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种音乐识别方法、音乐识别装置、电子设备及存储介质。
背景技术
目前,在很多的音乐识别过程中常常采用人工提取特征的方式对音乐的流派、情感等进行识别,这一方式往往会存在着特征提取不全面等问题,影响音乐识别的准确性,因此,如何提高音乐识别的准确性,成为了亟待解决的技术问题。
发明内容
本申请实施例的主要目的在于提出一种音乐识别方法、音乐识别装置、电子设备及存储介质,旨在提高音乐识别的准确性。
为实现上述目的,本申请实施例的第一方面提出了一种音乐识别方法,所述方法包括:
获取目标音乐的音乐数据,其中,所述音乐数据包括所述目标音乐的音频数据和歌词文本数据;
对所述音频数据进行音频特征提取,得到目标音乐音频特征,其中,所述目标音乐音频特征包含所述目标音乐的韵律特点;
对所述歌词文本数据进行上下文提取,得到目标音乐歌词特征,其中,所述目标音乐歌词特征包含所述目标音乐的文本内容特点;
对所述目标音乐音频特征和所述目标音乐歌词特征进行特征拼接,得到目标音乐表征特征;
基于预设的候选音乐流派标签对所述目标音乐表征特征进行流派识别,得到所述目标音乐的目标流派类别;
基于预设的候选音乐情感标签对所述目标音乐表征特征进行情感识别,得到所述目标音乐的目标情感类别。
在一些实施例,所述对所述音频数据进行音频特征提取,得到目标音乐音频特征,包括:
对所述音频数据进行频谱变换,得到初始音乐频谱图;
对所述初始音乐频谱图进行滤波处理,得到目标音乐频谱图;
基于预设的音频特征提取网络对所述目标音乐频谱图进行特征提取,得到所述目标音乐音频特征,其中,所述音频特征提取网络为深度可分离卷积神经网络。
在一些实施例,所述音频特征提取网络包括第一卷积层、第二卷积层、第三卷积层以及第四卷积层,所述基于预设的音频特征提取网络对所述目标音乐频谱图进行特征提取,得到所述目标音乐音频特征,包括:
基于所述第一卷积层对所述目标音乐频谱图进行第一卷积处理,得到第一音频特征;
基于所述第二卷积层对所述第一音频特征进行第二卷积处理,得到第二音频特征;
基于所述第三卷积层对所述第二音频特征进行第三卷积处理,得到第三音频特征;
基于所述第四卷积层对所述第三音频特征进行第四卷积处理,得到第四音频特征;
对所述目标音乐频谱图和所述第四音频特征进行特征相加,得到所述目标音乐音频特征。
在一些实施例,所述对所述歌词文本数据进行上下文提取,得到目标音乐歌词特征,包括:
对所述歌词文本数据进行词嵌入处理,得到歌词文本嵌入特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310574540.X/2.html,转载请声明来源钻瓜专利网。