[发明专利]基于核范数的鲁棒音阶轮廓特征提取算法有效
申请号: | 201611132721.3 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106782583B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 李锵;王蒙蒙;关欣 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L21/013 | 分类号: | G10L21/013;G10L21/0224;G10L21/0232;G10L25/18;G10L25/45 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 范数 音阶 轮廓 特征 提取 算法 | ||
本发明公开了一种专基于核范数的鲁棒音阶轮廓特征提取算法,步骤1、待输入音乐信号转换;步骤2、对音乐信号进行加窗处理,并进行傅立叶变换,得到音乐信号的时频矩阵,确定起始节拍点;步骤3、利用核范数约束对时频矩阵的秩进行频谱低秩化;同时用一范数约束矩阵中的噪声点,用以下凸优化问题对信号频谱进行低秩化,并去除噪声;步骤4、在迭代约束过程中,利用频谱的低秩特性,实现阈值自适应调整算法;步骤5、对时频矩阵进行有效的降维处理,得到12维的和弦特征。与现有技术相比,本发明提取出了鲁棒性的和弦特征;有效地降低了算法的时间;能准确地恢复不同类型和风格的音乐信号的音阶轮廓特征。
技术领域
本发明属于计算机听觉系统中的音频信号分析领域,特别是涉及一种音阶轮廓特征提取算法。
背景技术
音乐的谐波成分是音乐的重要元素,是音乐信息检索领域的重要课题。音频信号的不同频率的基频及其谐波成分是构成和弦并影响音乐色彩的重要成分。另外,不同频率成分在时间上的延伸时构成和弦行进的关键因素。直观的讲,和弦持续时间内的音乐在频域会呈现一定的结构性——低秩特性。音乐的和弦特征提取属于计算机听觉系统中的音频信号分析中的一部分,这个领域主要处理从声音信号中分离出来的各种各样的信息。同时,音乐的和弦特征也是提取一些高级音乐信息的基础。
音乐的中级特征是指从音频信号中提取出来的,并能够表示音频信号的信息,最终能够作为高级特征的一部分。近年来,有许多学者提出了多种能够表征音乐的中级特征。其中应用最为广泛的就是音级轮廓特征(Pitch Class Profiles,PCP)。然而,由于原始音乐信号中包含有人声、鼓点、爆破音以及高斯噪声,使得PCP特征性能的好坏与要分析的音乐信号的类型有很大的关系。有许多学者提出了基于PCP的改进方案,例如,Gomez提出的HPCP(Harmonic PCP),Lee提出的EPCP(Enhanced PCP)。这些方案都从改变频域提取成分着手,进而得到适合于特定音乐类型的性能优越的特征。
另外,从和弦行进来讲,由于每个和弦都有一定的持续时间,在这段时间内PCP特征的稳定性决定了和弦识别的准确率。有许多学者提出了基于PCP行进-chromagram的改进方案。Fujisjima假定和弦持续数帧,采用滑动窗均值滤波,从而减少噪声的影响,并且避免了和弦频繁变化;GeoffroyPeeters采用滑动窗中值滤波,来避免和弦的频繁变化;Bello假定和弦在一个节拍内是不变化的,使用节拍同步技术来避免和弦频繁变化。
大部分节拍跟踪模型由音符端点检测、端点强度曲线周期提取两部分组成。不论哪种模型,端点检测的根本目的都是选取有效的端点曲线的峰值,其本质上是极值点是否为节拍点的聚类问题。
可见,大部分和弦特征提取方案都未考虑音乐信号在频谱上表现出来的结构性,应用一些已知的假设,从而采用一些简单的处理方法来优化和弦特征。
发明内容
基于现有技术,本发明提出了一种基于核范数的鲁棒音阶轮廓特征提取算法,将和弦特征提取问题转化为凸优化问题,利用核范数约束和一范数约束,同时,利用和弦的频谱所表现出来的低秩特性,实现了阈值自适应算法。
本发明的一种专基于核范数的鲁棒音阶轮廓特征提取算法,该算法包括以下步骤:
步骤1、将待输入音乐信号转换为采样率22050Hz/16bit/单通道的标准音频,作为被参考的音频信号x(n),其中n为转换后音频信号所包含的数据点数;
步骤2、对音乐信号x(n)进行加窗处理,窗函数为W(k),其中k为窗函数的窗口宽度,从而得到信号时域矩阵Xk×m,其中X·,m=x(k·m/2:k·m/2+m)·W(k),m为分帧之后得到的帧数,然后进行傅立叶变换(Fourier Transform),得到音乐信号的时频矩阵D=F·X,其中F为傅里叶变换矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611132721.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:个人音色特征融入到歌曲里的方法
- 下一篇:音频信号处理设备、方法和电子设备