[发明专利]一种基于临界频带的双耳语音分离方法在审

专利信息
申请号: 201710479139.2 申请日: 2017-06-22
公开(公告)号: CN107346664A 公开(公告)日: 2017-11-14
发明(设计)人: 谈雅文;汤一彬;陈秉岩;高远 申请(专利权)人: 河海大学常州校区
主分类号: G10L21/0308 分类号: G10L21/0308
代理公司: 常州市科谊专利代理事务所32225 代理人: 孙彬
地址: 213022 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 临界 频带 耳语 音分 方法
【说明书】:

技术领域

发明涉及声源定位和语音分离领域,具体涉及一种基于临界频带的双耳语音分离方法。

背景技术

语音定位和分离技术是语音信号处理系统的前端,其性能对整个语音信号系统影响非常大。从数字通信时代开始,语音编解码、语音定位、语音分离、语音增强等语音处理技术都得到了迅速的发展,特别在当前的互联网浪潮中,语音助手将语音信号处理推向了一个新的高度。

未来多模态人机交互的发展,人机对话和语音识别离不开语音信号处理的研究和发展,所以语音分离技术作为语音处理系统的前端,直接关系到整个语音系统的性能和效果。

发明内容

发明目的:为了克服现有技术中存在的不足,本发明提供一种基于临界频带的双耳语音分离方法,利用人耳听觉系统的分频处理机制,结合人耳的听觉掩蔽效应,模拟人耳的听觉特征,基于临界频带划分,对每一帧信号划分不同的子带获取准确的混合矩阵进行语音分离,改进了现有技术的不足。

技术方案:一种基于临界频带的双耳语音分离方法,其特征在于,该方法包括以下步骤:

1)参数训练阶段:

1.1)使用具有方向性的双耳白噪声信号进行训练,所述双耳白噪声信号为与头相关脉冲响应函数HRIR数据与单声道白噪声信号卷积生成的方位已知的双耳信号,声源方位角θ定义为方向矢量在水平面的投影与中垂面的夹角,其范围为[-90°,90°],间隔为5°;

1.2)对已知方位信息的双耳白噪声信号进行预处理,所述预处理过程包括幅度归一化处理、分帧加窗,得到分帧后的单帧双耳声信号;

幅度归一化方法为:

xL=xL/maxvalue

xR=xR/maxvalue

其中xL和xR分别表示左耳声信号和右耳声信号;maxvalue=max(|xL|,|xR|)表示左耳、右耳声信号幅度的最大值。

分帧加窗使用汉明窗对分帧后的语音信号进行加窗处理,加窗后的第τ帧信号可以表示为:

xL(τ,n)=wH(n)xL(τN+n) 0≤n<N

xR(τ,n)=wH(n)xR(τN+n) 0≤n<N

其中xL(τ,n)、xR(τ,n)分别表示第τ帧的左、右耳声信号;N为一帧采样数据长度。

1.3)对步骤1.2)中得到的单帧双耳语音信号进行互相关函数运算,利用互相关函数计算单帧信号的耳间时间差ITD估计值。同一方位所有帧ITD估计值的均值作为该方位的ITD训练值,记为δ(θ)。

建立方位角θ的ITD模型的方法如下:

第τ帧信号的ITD值为:

将该θ方位的双耳白噪声信号对应所有帧的ITDτ求均值δ(θ),作为θ方位的训练ITD参数:

其中frameNum表示θ方位的双耳白噪声信号分帧后的总帧数,

这样建立了方位角θ与训练IID参数之间的模型。

1.4)对步骤1.1)中得到的单帧双耳语音信号进行短时傅里叶变换,将其变换到频域,计算左耳声信号和右耳声信号在每个频点幅度谱的比值,即耳间强度差IID矢量,同一方位所有帧IID估计值的均值作为该方位的IID训练值,记为α(θ,ω),ω表示傅里叶变换的频谱。

建立方位角θ的IID模型的方法如下:

第τ帧信号的IID值为:

其中,XL(τ,ω)和XR(τ,ω)分别xL(τ,m)、xR(τ,m)的频域表示,即短时傅里叶变换:

其中x(τ,n)表示第τ帧声信号,分别对左、右耳声信号进行傅里叶变换;ω表示角频率矢量,范围为[0,2π],间隔为2π/512;

将该θ方位的双耳白噪声信号所有帧的IID(τ,ω)求均值α(θ,ω),作为θ方位的训练IID参数:

其中frameNum表示θ方位的双耳白噪声信号分帧后的总帧数,

这样建立了方位角θ与训练IID参数之间的模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710479139.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top