[发明专利]基于组稀疏低秩表达的语音信号增强方法有效

申请号：	201310439143.8	申请日：	2013-09-24
公开（公告）号：	CN103559886B	公开（公告）日：	2017-04-12
发明（设计）人：	李平;卜佳俊;陈纯;高珊;王学庆	申请（专利权）人：	浙江大学
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0272
代理公司：	杭州天正专利事务所有限公司33201	代理人：	王兵,黄美娟
地址：	310027 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于稀疏表达语音信号增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音信号增强的技术领域，特别是基于组稀疏低秩表达的语音信号增强方法。

背景技术

随着数字媒体设备在人们日常工作和生活中的普及，特别是互联网技术的迅速发展壮大，每天都产生海量的语音数据，这些数据对现实生活中很多领域的交流与合作有着至关重要的影响。然后，由于各种客观环境条件的制约，如家居中小孩的滴哭声、会议室外的车辆喧闹声、实验室内的机器运转声和战争中的炸弹声等等，导致音频设备采集的语音信号通常伴随着不同程度的噪声。因此，如何有效分离语音数据中的噪声成分，增强语音信号是学术界和工业界非常关心且一直在研究探讨的问题。语音信号的增强技术，主要指从不同的噪声背景下提取有效而清晰的语音信号，抑制、降低甚至消除噪声干扰。

目前，针对语音信号的增强处理集中在传统的数字和模拟信号处理中，如现有的典型语音增强方法主要有基于小波分析、谱相减、卡尔曼滤波、信号子空间、听觉掩蔽效应、神经网络、独立主成分分析等等。这些技术对于语音信号较少且不稳定的情况是很占优势的，但是随着大数据时代的到来，海量的语音数据唾手可得，这为利用统计机器学习方法解决带噪语音信号的噪声抑制提供了可能性。从机器学习的角度，将不同类型的语音信号看成数据样本，可以利用已有的许多鲁棒学习方法获得带噪语音数据的低维低秩本征表达，保留尽可能多的原始语音信号，而抑制或丢弃无关的噪声信息，从而实现语音信号和噪声信号的分离，提高听者对语音信号传递内容的鉴别理解能力。在语音数据极为丰富的情形下，使用统计机器学习的方法处理带噪语音信号具有传统信号处理方法无法比拟的优势，具有很强的现实意义和重要的研究价值。

发明内容

为了让用户对多种混合的带噪语音信号提高辨听力，本发明提出了一种基于组稀疏低秩表达的语音信号增强方法，该方法包括以下步骤：

1、获取不同主题的大量带噪语音信号后，针对带噪语音信号进行以下操作：

1)根据预设的采样频率f_s对每个带噪语音信号进行采样，获得m维的向量化表达x∈R^m，并按照不同主题对语音信号分组；

2)利用同主题语音信号间的组稀疏结构特性，通过低秩矩阵分解对带噪语音信号实现噪声分离，并得到语音信号的组稀疏低秩表达；

3)通过获得的低秩表达对原始带噪信号进行重构，从而输出清晰的增强语音信号。

进一步，步骤1)中所述的按照不同主题对语音信号分组，具体是：

1)假设语音信号可分为k个主题，则第c个主题的语音信号矩阵表示为，其中n_c为第c个主题的语音信号数目；

2)通过按顺序拼接不同主题的信号矩阵块，可构造整体语音信号矩阵X＝[X¹，…，X^k]∈R^m×n，其中n＝n₁+n₂+…+n_k。

进一步，步骤2)中所述的利用同主题语音信号间的组稀疏结构特性，通过低秩矩阵分解对带噪语音信号实现噪声分离，并得到语音信号的组稀疏低秩表达，具体是：

1)假设第c个主题语音信号的组稀疏低秩表达为Z^c，则同主题语音信号间的组稀疏结构特征可通过矩阵的l_1，q范式表征为 Σc=1k||Zc||1,q,]]>其中