[发明专利]一种语音端点检测方法及装置无效
申请号: | 201010609503.0 | 申请日: | 2010-12-28 |
公开(公告)号: | CN102097095A | 公开(公告)日: | 2011-06-15 |
发明(设计)人: | 苏伟博 | 申请(专利权)人: | 天津市亚安科技电子有限公司 |
主分类号: | G10L11/00 | 分类号: | G10L11/00 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王来佳 |
地址: | 300384 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于视频监控领域,提供了一种语音端点检测方法及装置,包括:对输入语音信号进行数据采样,并对采样后的语音信号进行预处理;对预处理过的语音信号加入汉明窗进行分帧处理,记为Rn(0<n≤N),N是帧的总数;计算第n帧语音信号的频谱信息熵;如果第n帧语音信号的频谱信息熵大于设定的阈值,将该帧判定为语音帧,否则判定为非语音帧。本发明应用了频谱熵作为语音和非语音的区分特征,可以有效的区分语音帧和非语音帧,对于低信噪比环境也有较好的检测效果,克服了传统的基于频谱熵的算法只考虑当前帧的频谱信息,在非平稳的噪声环境下噪声频谱信息熵波动很大,增加了阈值选择的难度的问题。 | ||
搜索关键词: | 一种 语音 端点 检测 方法 装置 | ||
【主权项】:
一种语音端点检测方法,首先对输入语音信号进行数据采样,并对采样后的语音信号进行预处理,接着对预处理过的语音信号加入汉明窗进行分帧处理,记为Rn(0<n≤N),N是帧的总数,其特征在于,所述检测方法还包括:计算第n帧语音信号的频谱信息熵;如果第n帧语音信号的频谱信息熵大于设定的阈值,将该帧判定为语音帧,否则判定为非语音帧。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津市亚安科技电子有限公司,未经天津市亚安科技电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010609503.0/,转载请声明来源钻瓜专利网。