[发明专利]基于卷积神经网络的单通道混合语音时域分离方法有效

专利信息
申请号: 201710084957.2 申请日: 2017-02-17
公开(公告)号: CN106847302B 公开(公告)日: 2020-04-14
发明(设计)人: 张鹏;马晓红 申请(专利权)人: 大连理工大学
主分类号: G10L21/0272 分类号: G10L21/0272;G10L21/0224;G10L25/30
代理公司: 大连星海专利事务所有限公司 21208 代理人: 王树本
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 卷积 神经网络 通道 混合 语音 时域 分离 方法
【说明书】:

发明涉及一种单通道混合语音的时域分离方法,一种基于卷积神经网络的单通道混合语音的时域分离方法,包括以下步骤:(1)建立用于训练的语音数据组,(2)对语音数据进行预处理,(3)获得混合的语音数据,(4)构造神经网络结构,(5)利用整理好的数据,对神经网络进行监督式训练,(6)利用训练好的神经网络进行分离测试。本发明是以时域语音信号作为卷积神经网络的输入和输出,将单通道的混合语音分离开来,从而得到两路源信号的估计。该方法不需要处理相位恢复的问题,提高了单通道语音的分离质量。

技术领域

本发明涉及一种单通道混合语音的时域分离方法,更具体地说,涉及一种基于卷积神经网络的单通道混合语音时域分离方法。

背景技术

单通道盲源分离(Monaural Blind Source Separation,MBSS)是语音处理领域中一项重要技术,它能在只获得单通道混合语音信号的情况下得到两路源信号的估计。单通道语音分离技术在在语音识别、语音增强、语音鉴定等领域具有重要的应用价值。

典型的单通道语音分离包括基于非负矩阵分解(Non-negative MatrixFactorization,NMF)和基于神经网络(Neural Network)的方法。由于单通道混合语音中所包含的信息较少,因此基于非负矩阵分解的方法很难取得令人满意的分离效果。而神经网络具有较强的特征表达能力,因此基于神经网络的方法可以取得比NMF方法更好的分离效果。但是,目前基于神经网络的方法一般采用全连接网络(Full Connected NeuralNetwork,FCNN)或循环神经网络(Recurrent Neural Network,RNN),并且通常需要提取语音信号的幅度谱特征,这样并没有很好地利用到卷积神经网络本身强大的特征表达能力;同时由于使用了幅度谱特征,使得在恢复源信号的时候面临着很难处理的相位恢复问题。因此,传统的基于神经网络的分离方法在分离出的两路源信号估计之间存在互扰,分离质量有待提高。

发明内容

为了克服现有技术中存在的不足,本发明的目的是提供一种基于卷积神经网络的单通道混合语音时域分离方法。该方法是以时域语音信号作为卷积神经网络的输入和输出,其作用是将单通道的混合语音分离开来,从而得到两路源信号的估计。该方法不需要处理相位恢复的问题,提高了单通道语音分离的质量。

为了实现上述发明目的,解决已有技术中存在的问题,本发明采用的技术方案是:基于卷积神经网络的单通道混合语音时域分离方法,包括以下步骤:

步骤1、建立用于训练的语音数据组,从一个标准数据库,例如,TSP语音数据库中随机选取大量语音数据,并分为两组,其中80%语音数据作为训练数据,余下20%作为测试数据;

步骤2、对语音数据进行预处理,首先利用公式(1)将原始的语音数据归一化到[-1,1]的范围内,

其中,si表示第i路源信号,max(·)表示取最大值,abs(si)表示对si中的每一个元素取绝对值,yi表示归一化后的第i路源信号。然后将时域语音信号利用公式(2)进行分帧处理,帧长为N=1024,帧间重叠为H,这里H=N/2,

zi={y(1+(N-H)*(i-1)),...,y((N-H)*(i-1)+N)} (2)

其中zi表示第i帧数据,y表示归一化后的数据;

步骤3,获得混合的语音数据,这里利用公式(3)所描述的循环移位混合的方法来扩大混合语音数据的数量,

其中,x表示循环移位后的输出,表示将W个向量串连起来,W等于L/τ,L表示原始语音信号s的长度,τ表示循环移位的点数长度,Ψ表示循环移位算子,利用公式(4)进行描述,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710084957.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top