[发明专利]基于核范数的鲁棒音阶轮廓特征提取算法有效
申请号: | 201611132721.3 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106782583B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 李锵;王蒙蒙;关欣 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L21/013 | 分类号: | G10L21/013;G10L21/0224;G10L21/0232;G10L25/18;G10L25/45 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种专基于核范数的鲁棒音阶轮廓特征提取算法,步骤1、待输入音乐信号转换;步骤2、对音乐信号进行加窗处理,并进行傅立叶变换,得到音乐信号的时频矩阵,确定起始节拍点;步骤3、利用核范数约束对时频矩阵的秩进行频谱低秩化;同时用一范数约束矩阵中的噪声点,用以下凸优化问题对信号频谱进行低秩化,并去除噪声;步骤4、在迭代约束过程中,利用频谱的低秩特性,实现阈值自适应调整算法;步骤5、对时频矩阵进行有效的降维处理,得到12维的和弦特征。与现有技术相比,本发明提取出了鲁棒性的和弦特征;有效地降低了算法的时间;能准确地恢复不同类型和风格的音乐信号的音阶轮廓特征。 | ||
搜索关键词: | 基于 范数 音阶 轮廓 特征 提取 算法 | ||
【主权项】:
一种专基于核范数的鲁棒音阶轮廓特征提取算法,其特征在于,该算法包括以下步骤:步骤(1)、将待输入音乐信号转换为采样率22050Hz/16bit/单通道的标准音频,作为被参考的音频信号x(n),其中n为转换后音频信号所包含的数据点数;步骤(2)、对音乐信号x(n)进行加窗处理,窗函数为W(k),其中k为窗函数的窗口宽度,从而得到信号时域矩阵Xk×m,其中X·,m=x(k m/2:k m/2+m)W(k),m为分帧之后得到的帧数,然后进行傅立叶变换(Fourier Transform),得到音乐信号的时频矩阵D=F X,其中F为傅里叶变换矩阵;步骤(3)、假设音频信号频谱所包含的谐波成分与噪声是相互独立的,即D=A+E,其中矩阵A表示频谱矩阵中所包含的谐波成分做构成的矩阵,而E表示频谱矩阵中所包含的噪声成分所构成的矩阵;根据以上假设,谐波矩阵A的恢复可以归结为以下凸优化问题:minA,E||A||*+λ||E||1]]>s.t.A+E=D其中|| ||*表示矩阵的核范数(nuclear norm),即矩阵的奇异值之和;|| ||1表示矩阵的一范数,即所有非零元素之和;分离出来的矩阵A就是低秩化之后的频谱,而矩阵E则包含稀疏大噪声以及其他非谐波成分,D则是原始的音乐信号的频谱;步骤(4)、在迭代约束过程中,利用频谱的低秩特性,实现阈值自适应调整算法;具体步骤如下:初始化奇异值截断阈值参数μ,参数λ,迭代索引k=0,临时矩阵Y0=D,E0为全零矩阵;进行奇异值分解得到奇异值矩阵Σ;接着,从μk到1.5μk等间隔选取二十个数据点其中1≤i≤20,对于每个进行奇异值分解逆操作由于谐波成分只分布在数个频率点上,因此计算矩阵中某一列的方差,并从中选取使得方差最大时,所对应的索引i,并使即完成阈值自适应选择算法;计算这一步得到的矩阵更新Yk+1=Yk+μk(D‑Ak+1‑Ek+1)和k=k+1直至收敛。步骤(5)、对时频矩阵进行有效的降维处理,得到12维的和弦特征。通常情况下,规定音符A0处的频率440Hz为基准频率,并通过获得其他音符处的频率值。其中b为音符与A0之间的音程差。然后,通过映射公式来对谐波矩阵A的各个频率成分进行映射,从而获得鲁棒音阶轮廓特征向量。其中x对应矩阵A每一行所对应的频率值,而fref则通过获得。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611132721.3/,转载请声明来源钻瓜专利网。
- 上一篇:个人音色特征融入到歌曲里的方法
- 下一篇:音频信号处理设备、方法和电子设备