[发明专利]一种基于NMF算法的单传声器语音分离方法在审

申请号：	201710137777.6	申请日：	2017-03-09
公开（公告）号：	CN108573711A	公开（公告）日：	2018-09-25
发明（设计）人：	李军锋;李煦;颜永红	申请（专利权）人：	中国科学院声学研究所
主分类号：	G10L21/0272	分类号：	G10L21/0272;G10L21/0308;G10L25/27;G10L15/02;G10L15/06
代理公司：	北京方安思达知识产权代理有限公司 11472	代理人：	王宇杨;陈琳琳
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于NMF算法的单传声器语音分离方法，该方法针对每个说话人的训练数据得到很多较小的字典矩阵和一个状态序列，以此来同时描述语音信号的谱结构信息和时间连续性；针对不同帧混合语音，相比于传统的算法采用了较大的字典矩阵而言，由于本发明的算法采用了不同的较小的字典矩阵来描述各帧语音幅度谱，避免了一个说话人的字典描述出另一个说话人的语音信息的现象发生，提高了算法的鲁棒性和语音分离效果。
搜索关键词：	算法矩阵字典语音传声器时间连续性分离效果结构信息训练数据语音幅度语音信号语音信息状态序列传统的鲁棒性帧混合
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于NMF算法的单传声器语音分离方法，其特征在于，包括：步骤1)针对两个说话人单独采集各自对应的语音信号；步骤2)对步骤1)中采集到的语音信号进行预处理，然后提取语音信号的幅度谱；步骤3)对每个说话人对应的语音信号幅度谱进行k均值聚类和非负矩阵分解，得到两个说话人对应的字典矩阵和状态序列；步骤4)通过步骤3)中得到的两个说话人对应的字典矩阵和状态序列训练FCRF模型；步骤5)对两个说话人的混合语音信号进行特征提取，然后将提取的特征送入经过训练的FCRF模型中进行解码，得到两个说话人状态的后验概率；步骤6)利用步骤5)中得到的后验概率和步骤3)中得到的字典矩阵重构两个说话人的语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所，未经中国科学院声学研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710137777.6/，转载请声明来源钻瓜专利网。

上一篇：一种实时去除录音回声的方法及装置
下一篇：语音活性检测模型生成方法、系统及语音活性检测方法、系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于NMF算法的单传声器语音分离方法在审

专利文献下载