[发明专利]利用能量谱熵空间信息的语音端点检测装置及其检测方法无效

专利信息
申请号: 201310370059.5 申请日: 2013-08-22
公开(公告)号: CN103426440A 公开(公告)日: 2013-12-04
发明(设计)人: 童峰;李芳兰;洪青阳;周跃海 申请(专利权)人: 厦门大学
主分类号: G10L25/78 分类号: G10L25/78
代理公司: 厦门南强之路专利事务所(普通合伙) 35200 代理人: 马应森;曾权
地址: 361005 *** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 能量 空间 信息 语音 端点 检测 装置 及其 方法
【说明书】:

技术领域

本发明涉及一种语音信号处理装置,尤其是涉及一种综合利用能量谱熵空间信息的语音端点检测装置及其检测方法。 

背景技术

在语音识别、声纹识别、视频会议等语音信号处理中利用语音的某种特性将有话部分和无话部分区分出来,称为语音端点检测。准确的语音端点检测将提高语音处理系统的处理效率和减少语音处理的数据量,从而达到提高语音识别系统识别性能的目的。常用的端点检测算法有基于短时能量和过零率、短时自相关、谱熵检测等,在安静的背景环境下,这些成熟的语音端点检测算法都有很好的端点检测性能,但在实际使用的带背景噪声的环境下,这些算法的检测性能往往不能令人满意。考虑到实际使用的大部分情况下采集到的语音信号是有背景噪声的,因此,研究可适应不同背景噪声情况下的语音端点检测对于提高语音信号处理系统的稳健性和实用性都起着关键的作用。 

中国专利ZL 200910088491.9公开一种低信噪比条件下的语音端点检测方法及装置,该方法对分帧语音信号进行子带功率谱熵概率密度加权处理,得到每个语音帧的子带加权功率谱熵,根据阈值进行端点检测,并根据实际应用环境自适应地选择子带数目和权重因子,提高了端点检测的准确性和精确度。 

中国专利ZL 200910135606.5公开一种可适应复杂噪声背景的端点检测方法及使用该方法的系统,该发明使用基频提取结合子带能量的方法对语音信号进行检测,由于语音中元音有基频,而基频拥有很强的语音特征,受噪声影响较小,使得元音的提取拥有很高的鲁棒性。并可改善不断变化的背景噪声下的端点检测性能。 

中国专利200510089957.9公开一种基于能量及谐波的语音端点检测方法,该方法利用能量进行语音起点初判,然后搜索具有浊音谐波特征的信号进行语音起点的准备检测,由于谐波检测可过滤突发噪声,因此该方法可适应噪声突变对语音端点检测的影响。 

但是,背景噪声除了前述几种方法所针对的非白噪声、突发噪声等非语音噪声,在大量使用移动电话、智能终端进行的人机交互语音识别、声纹识别等语音信号处理场合,除了目 标说话人外,往往存在其他说话人的语音干扰。此时,与上述几种方法可结合语音信号频谱,基频、浊音谐波特性等特征改善端点检测的噪声稳健性不同,由于有用语音信号混杂的是具有同样语音特性的其他说话人语音噪声,需利用其他信息来排除语音噪声的影响,保证端点检测的性能。 

麦克风阵列(L.J.Griffiths,C.W.Jim.An alternative approach to linearly constrained adaptive beamforming.IEEE Transactions on Antennas and Propagation.January,1982,vol.30,pp27-34;Sharon Gannot,Israel Cohen.Speech Enhancement Based on the General Transfer Function GSC and Post filtering.IEEE Transactions on Speech and Audio Processing.2004,vol.12,no.6;A Abad,J Hernando.Speech Enhancement and recognition by Integrating Adaptive Beamforming and Wiener Filtering.IEEE Sensor Array and Multichannel Signal Processing Workshop,SAM,Sitges,2004)由多个麦克风按照一定拓扑结构组成,其采集到的信号在时频域的基础上增加了空间域信息,从而可对采集到的多路信号进行空时分集处理,麦克风阵列可对不同方向上的信号形成不同响应,也即阵列的空间指向特性,使阵列麦克风具有声源定位和跟踪、语音提取和分离以及去噪等功能,从而提高在复杂背景下的语音信号质量,弥补孤立麦克风无法获取和利用空间信息的缺陷。目前,各类移动电话、智能终端普遍开始配置由两个或多个麦克风组成的麦克风阵列以提高语音信号处理性能,但目前的各类端点检测算法大多基于单麦克风,未采用麦克风阵列提供的声源空间信息来改善性能。 

发明内容

本发明的目的在于提供一种综合利用能量谱熵空间信息的语音端点检测装置及其检测方法。 

本发明所述利用能量谱熵空间信息的语音端点检测装置设有: 

麦克风阵列,用于语音信号多通道采集、前置处理和模数转换; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310370059.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top