[发明专利]利用能量谱熵空间信息的语音端点检测装置及其检测方法无效
申请号: | 201310370059.5 | 申请日: | 2013-08-22 |
公开(公告)号: | CN103426440A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 童峰;李芳兰;洪青阳;周跃海 | 申请(专利权)人: | 厦门大学 |
主分类号: | G10L25/78 | 分类号: | G10L25/78 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森;曾权 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 能量 空间 信息 语音 端点 检测 装置 及其 方法 | ||
技术领域
本发明涉及一种语音信号处理装置,尤其是涉及一种综合利用能量谱熵空间信息的语音端点检测装置及其检测方法。
背景技术
在语音识别、声纹识别、视频会议等语音信号处理中利用语音的某种特性将有话部分和无话部分区分出来,称为语音端点检测。准确的语音端点检测将提高语音处理系统的处理效率和减少语音处理的数据量,从而达到提高语音识别系统识别性能的目的。常用的端点检测算法有基于短时能量和过零率、短时自相关、谱熵检测等,在安静的背景环境下,这些成熟的语音端点检测算法都有很好的端点检测性能,但在实际使用的带背景噪声的环境下,这些算法的检测性能往往不能令人满意。考虑到实际使用的大部分情况下采集到的语音信号是有背景噪声的,因此,研究可适应不同背景噪声情况下的语音端点检测对于提高语音信号处理系统的稳健性和实用性都起着关键的作用。
中国专利ZL 200910088491.9公开一种低信噪比条件下的语音端点检测方法及装置,该方法对分帧语音信号进行子带功率谱熵概率密度加权处理,得到每个语音帧的子带加权功率谱熵,根据阈值进行端点检测,并根据实际应用环境自适应地选择子带数目和权重因子,提高了端点检测的准确性和精确度。
中国专利ZL 200910135606.5公开一种可适应复杂噪声背景的端点检测方法及使用该方法的系统,该发明使用基频提取结合子带能量的方法对语音信号进行检测,由于语音中元音有基频,而基频拥有很强的语音特征,受噪声影响较小,使得元音的提取拥有很高的鲁棒性。并可改善不断变化的背景噪声下的端点检测性能。
中国专利200510089957.9公开一种基于能量及谐波的语音端点检测方法,该方法利用能量进行语音起点初判,然后搜索具有浊音谐波特征的信号进行语音起点的准备检测,由于谐波检测可过滤突发噪声,因此该方法可适应噪声突变对语音端点检测的影响。
但是,背景噪声除了前述几种方法所针对的非白噪声、突发噪声等非语音噪声,在大量使用移动电话、智能终端进行的人机交互语音识别、声纹识别等语音信号处理场合,除了目 标说话人外,往往存在其他说话人的语音干扰。此时,与上述几种方法可结合语音信号频谱,基频、浊音谐波特性等特征改善端点检测的噪声稳健性不同,由于有用语音信号混杂的是具有同样语音特性的其他说话人语音噪声,需利用其他信息来排除语音噪声的影响,保证端点检测的性能。
麦克风阵列(L.J.Griffiths,C.W.Jim.An alternative approach to linearly constrained adaptive beamforming.IEEE Transactions on Antennas and Propagation.January,1982,vol.30,pp27-34;Sharon Gannot,Israel Cohen.Speech Enhancement Based on the General Transfer Function GSC and Post filtering.IEEE Transactions on Speech and Audio Processing.2004,vol.12,no.6;A Abad,J Hernando.Speech Enhancement and recognition by Integrating Adaptive Beamforming and Wiener Filtering.IEEE Sensor Array and Multichannel Signal Processing Workshop,SAM,Sitges,2004)由多个麦克风按照一定拓扑结构组成,其采集到的信号在时频域的基础上增加了空间域信息,从而可对采集到的多路信号进行空时分集处理,麦克风阵列可对不同方向上的信号形成不同响应,也即阵列的空间指向特性,使阵列麦克风具有声源定位和跟踪、语音提取和分离以及去噪等功能,从而提高在复杂背景下的语音信号质量,弥补孤立麦克风无法获取和利用空间信息的缺陷。目前,各类移动电话、智能终端普遍开始配置由两个或多个麦克风组成的麦克风阵列以提高语音信号处理性能,但目前的各类端点检测算法大多基于单麦克风,未采用麦克风阵列提供的声源空间信息来改善性能。
发明内容
本发明的目的在于提供一种综合利用能量谱熵空间信息的语音端点检测装置及其检测方法。
本发明所述利用能量谱熵空间信息的语音端点检测装置设有:
麦克风阵列,用于语音信号多通道采集、前置处理和模数转换;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310370059.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于装配汽车自动助力机构中磁环的装置
- 下一篇:一种新型折弯模具
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置