[发明专利]基于模糊聚类算法的音乐旋律轮廓提取方法及装置在审
申请号: | 202211296379.6 | 申请日: | 2022-10-21 |
公开(公告)号: | CN115658957A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 姚三军 | 申请(专利权)人: | 怀化学院 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06F16/683;G06F18/2337 |
代理公司: | 北京园田林慧知识产权代理事务所(普通合伙) 11986 | 代理人: | 陆岩 |
地址: | 418000 湖南省怀*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 算法 音乐 旋律 轮廓 提取 方法 装置 | ||
本发明实施例中提供了一种基于模糊聚类算法的音乐旋律轮廓提取方法、装置及电子设备,属于人工智能技术领域,该方法包括:根据高斯混合模型的模糊聚类算法,构建相关的目标函数;获取二进制形式存储的音乐文件,对所述音乐文件执行特征提取;使用谐波求和和源滤波模型的组合来计算音高显著性,滤波模型来计算音高显著性,以获得旋律的候选音高,然后创建音高轮廓,以便于进一步提取旋律音高轮廓。采用本方案,能够提高音乐轮廓提取的准确性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于模糊聚类算法的音乐旋 律轮廓提取方法、装置及电子设备。
背景技术
20世纪90年代初,为了满足图像、视频和其他二维多媒体信息检索和基于 内容的多媒体信息检索的需要,基于内容的多媒体检索技术应运而生,并在理 论研究和实际应用中迅速发展和应用。歌谱信息是音乐检索的目标。歌谱轮廓 特征是由音高轮廓特征,而音高是哼唱检索的基础。传统的模糊c-means聚类分 析方法在聚类分析中,对样本的不同特征一视同仁,忽视了关键特征对聚类结 果的重要影响。对聚类结果的重要影响,导致聚类结果与实际分类之间存在一 定差距。
发明内容
有鉴于此,本发明实施例提供一种基于模糊聚类算法的音乐旋律轮廓提取 方法、装置及电子设备,至少部分解决现有技术中存在的问题。
第一方面,本发明实施例提供了一种基于模糊聚类算法的音乐旋律轮廓提 取方法,包括:
根据高斯混合模型的模糊聚类算法,构建相关的目标函数;
获取二进制形式存储的音乐文件,对所述音乐文件执行特征提取;
使用谐波求和和源滤波模型的组合来计算音高显著性,滤波模型来计算音 高显著性,以获得旋律的候选音高,然后创建音高轮廓,以便于进一步提取旋 律音高轮廓。
根据本公开实施例的一种具体实现方式,所述构建相关的目标函数,包括:
构建如下目标函数:
(Θ)=∑i=ln∑j=lkzijdij+λ
∑i+ln∑j=lD
((sijl lg sijlρ1+(1-sijl)lg1-sijl1-ρ1)
∑j∈11≤i≤N
sijl∈[0,1]1≤i≤N,1≤k
dij=-∑1=1D(sijl|lgΦjl(xilμjl,σ2jl)+(1-sijl)
Φ=(xilεl,v21)Φjl(xil,σ2jl,2jl
其中,dij为第i个样本与第j个中心之间的加权似然距离J,Sijl为第i个 样本中第L个特征属性xil对第j个类的影响程度,ujl为第L个特征,σ2jl是 第i个样本中第L个特征属性xil对第j个类的影响程度,jl是第j个样本平均值 对应的第L个特征,εL是平均值对应的第L个特征属性值;2jl是第L个特征 属性值对应的第j个样本方差,ρL是对应于所有样本平均值的第L个特征属 性值。
根据本公开实施例的一种具体实现方式,所述方法还包括:
构建函数
根据本公开实施例的一种具体实现方式,所述方法还包括:
找到声谱上的每个峰点,得到一个音乐片段的音高序列SN,然后估计音高 频率;
将每一帧的长度扩大3倍,将音频数据中的4096个点扩大到16384个点, 将所有的扩展数据填充为零,然后再进行FFT变换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于怀化学院,未经怀化学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211296379.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:喷射装置及烟气脱硝系统
- 下一篇:光伏百叶窗