[发明专利]一种基于NMF非负矩阵分解的音频分离方法无效

专利信息
申请号: 201210541700.2 申请日: 2012-12-13
公开(公告)号: CN103871423A 公开(公告)日: 2014-06-18
发明(设计)人: 王雷 申请(专利权)人: 上海八方视界网络科技有限公司
主分类号: G10L21/028 分类号: G10L21/028;G10L19/032;G10L15/06
代理公司: 上海申新律师事务所 31272 代理人: 袁亚军
地址: 200941 上海市宝*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 nmf 矩阵 分解 音频 分离 方法
【说明书】:

技术领域

发明涉及语音信号分解领域,具体涉及一种基于NMF非负矩阵分解的音频分离方法。

背景技术

当一段音频当中既混杂有背景的音乐音频,也有语音音频时,为了获取单一的语音音频或者音乐音频以便进行相应的编码、信息检索等工作,便需要利用相应的算法将混杂的音频分离为单纯的语音音频与音乐音频。这样的一种音频处理方式,一般会利用信号分离的相关技术来解决。随着音频处理领域的技术发展,对于这样技术的需要也催生了相应的研究成果。

在面对这类语音和音乐混叠信号的分离的问题时,现在主要是基于基频分析和频谱分解算法来进行的。例如,Klapuri等人提出了一种基于音乐频谱的谐波特性和平滑特性的迭代算法来检测音乐频谱中的多个基频并计算出各基频对应的谐波分量;Li 通过检测歌曲音频信号的主要基频轮廓,用聚类学习的方法从混叠信号中分离出歌声信号等等,都取得了不错的音频分离效果。

目前,NMF即非负矩阵分解法是很多研究者关注的重点。NMF 的基本原理是将信号分解为基本矩阵和相应的系数矩阵,根据代价函数来计算各个信源成分所对应的基本矩阵和系数矩阵,从而实现信号的分离。根据一直音频信号的先验知识获得的多少,可以将NMF分为盲信号模型,监督模型,和半盲模型,即完全不知道先验信号成分基本矩阵,知道所有混叠信号成分的基本矩阵,与只知道部分混叠信号成分的基本矩阵。而代价函数的选取主要包括分离前后信号的相似度与根据所处理信号的特性而加入的一些限制条件两类。因此,目前并没有非负矩阵分解的音频分离方法

本发明所需要处理的问题即属于盲信号模型的NMF信号分离问题;它需要利用分离前后信号的相似度作为代价函数,并辅之以语音音频与音乐音频在音频特征的差异度作为另外的递归终止条件。

发明内容

为克服现有技术上的不足,本发明目的是在于提供了一种基于NMF非负矩阵分解的音频分离方法,其通过利用NMF进行非负矩阵分解,从而将音乐与语音的混杂音频文件分解成为单纯的音乐音频文件和语音音频文件,通过对于每次分解后的音频文件进行特征提取与判别,从而判断每一次分解的结果是否为音乐文件或者语音文件。

为解决上述问题,本发明采用如下技术方案:一种基于NMF非负矩阵分解的音频分离方法,包括辅助音乐语音区分模块和NMF非负矩阵分解模块,

所述的辅助音乐语音区分模块主要利用了机器学习的方法,通过提取大量的语音音乐音频的相关音频特征作为训练样本,通过SVM算法进行训练得到识别模型;

所述的NMF非负矩阵分解模块利用NMF非负矩阵分解方法,通过对原音频信号矩阵进行迭代分解,直到分解结果达到代价函数与辅助区分模块的要求则停止。

进一步地,所述的辅助音乐语音区分模块利用机器学习的方法步骤:

a、需要采集大量的语音、音乐以及既非语音也非音乐的音频文件作为训练样本,从而得到相应的区分模型。其中反面样本的选取可以更好的保证;

b、提取音频特征中的静音帧率、高过零率帧比率、低能量帧率、谱通量以及和谐度五个音频量化特征构成每个音频的特征向量,作为及其学习训练的输入向量集。之所以提取这五个特征,是因为语音音频与音乐音频在这五个特征当中有较大的差异,因此利用这五个特征可以有较好的特征提取效果;

c、利用SVM算法对于b中所得到的向量集进行建模,得到所需要的用以识别语音与音乐视频的识别模型。

进一步地,所述的NMF非负矩阵分解模块主要有以下几个方面:

a、首先,我们会得到下面NMF非负矩阵分解的基本依据公式;

b、而后,我们会依据在盲状态模型构建出符合本发明要求的欧几里得距离代价函数,即判断分解结束的主要条件;

c、依据此代价函数与基本函数,我们会得到用以分解原信号矩阵的迭代公式,并依据迭代公式进行迭代分解;

d、当每次迭代完成之后,将利用预先设定的JEuc1门限进行判别,如果达到门限则提取两个矩阵的相应特征向量,利用之前得到的语音音乐模型进行是否为语音或者音乐的判断。如果判断失败,则继续利用c中所述方法进行迭代分解,如果判断成功则在判断其是否达到门限JEuc2,直到达到该门限时,停止迭代过程。

进一步地,所述的NMF非负矩阵分解的基本依据公式为:

Y=Ys+Ym+V=AsXs+AmXm+V

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海八方视界网络科技有限公司,未经上海八方视界网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210541700.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top