[发明专利]提取语音信号的特性信息的语音信号预处理系统及方法有效
申请号: | 200710079190.0 | 申请日: | 2007-02-15 |
公开(公告)号: | CN101051460A | 公开(公告)日: | 2007-10-10 |
发明(设计)人: | 金炫秀 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L15/28 |
代理公司: | 北京铭硕知识产权代理有限公司 | 代理人: | 郭鸿禧;刘奕晴 |
地址: | 韩国京畿道水*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 语音 信号 特性 信息 预处理 系统 方法 | ||
技术领域
本发明总体上涉及一种语音信号识别系统,具体地说,涉及一种提取语音信号的特性信息的语音信号预处理系统。
背景技术
通常,语音信号预处理对于根据语音信号的频谱消除语音信号的噪声和提取语音信号的特性信息是非常重要的处理,所述语音信号的特性诸如包络、基音、浊音/清音等,所述特性可用于下一阶段的语音信号处理系统(包括所有语音相关的系统,诸如编码器/解码器(编解码器)、合成、识别等)。
用于提取根据下一阶段的语音信号处理系统的需要而指定的语音信号的特性信息的系统通常可被应用于执行语音信号预处理的语音信号预处理系统。语音信号预处理系统的示例是用于提取语音信号的特性信息的预处理系统,所述系统基于在码激励线性预测(CELP)系列编解码器中经常使用的线性预测(LP)。
这种传统的语音信号预处理系统使用LP分析方法来检测语音信号并提取检测的语音信号的特性信息。使用LP分析方法,通过仅使用参数表示语音信号的特性信息可减少计算量。LP分析方法通过使用过去的语音信号样本从线性集假定当前样本,来从过去样本值估计当前值。这种传统LP分析方法具有下面的优点:可使用较少的参数表示语音信号的波形和频谱,并且可通过简单计算提取这些参数。
然而,因为使用传统LP分析方法的语音信号预处理系统包括用于提供诸如语音信号的基音、频谱、浊音/清音等特性的各个系统,所以如果下一阶段的语音信号处理系统被改变,则语音信号预处理系统也应该被改变。
发明内容
本发明的目的在于实质上至少解决上述问题和/或缺点,并至少提供下述优点。因此,本发明的目的在于提供一种提取语音信号的特性信息的语音信号预处理系统和方法,从而可通过合成地提取语音信号的特性信息来选择性地提供由各种语音信号处理系统请求的语音信号的特性。
根据本发明的一方面,提供一种语音信号预处理系统,所述系统包括:语音信号识别单元,用于从输入信号中识别语音,并且输出所述输入信号作为语音信号;语音信号转换器,用于通过接收语音信号并且将接收的时域的语音信号转换为频域的语音信号,来产生语音信号帧;形态学分析器,用于接收语音信号帧,并且通过形态学运算产生具有基于形态学分析的信号波形的特性频率区域;语音信号特性信息提取器,用于接收语音信号帧或基于形态学分析的特性频率区域,并且提取下一阶段的语音信号处理系统请求的语音信号特性信息;以及控制器,用于根据预设确定条件确定是否使用语音信号帧的谐波峰值提取语音信号的特性信息,并且当使用谐波峰值时通过将语音信号帧输出到语音信号特性信息提取器或者当不使用谐波峰值时通过输出语音信号帧的基于形态学分析的特性频率区域,来提取语音信号处理系统请求的语音信号特性信息。
根据本发明的另一方面,提供一种提取语音信号的特性信息的方法,所述方法包括:通过从输入信号中识别语音,提取所述语音,将接收的时域的语音信号转换为频域的语音信号,并且输出语音信号,从而产生语音信号帧;根据预设确定条件确定是否使用语音信号帧的谐波峰值提取语音信号的特性信息;根据谐波峰值使用确定结果执行语音信号帧的形态学分析,并根据形态学分析结果提取特性频率区域;根据谐波峰值使用确定结果使用语音信号帧的特性频率区域来提取下一阶段的语音信号处理系统请求的语音信号特性信息;以及将提取的语音信号特性信息输出到语音信号处理系统。
附图说明
通过下面结合附图进行的详细描述,本发明的上述和其它目的、特点和优点将会变得更加清楚,其中:
图1是根据本发明的语音信号预处理系统的框图;
图2是根据本发明的根据语音信号预处理系统的形态学分析结果输出的语音信号的波形图(a)和(b);
图3是示出根据本发明的在语音信号预处理系统中使用谐波峰值或形态学分析方案输出语音信号的特性信息的处理的流程图;
图4是示出根据本发明的在语音信号预处理系统中根据语音信号处理系统请求的信息输出语音信号特性的处理的流程图;
图5是示出根据本发明的在语音信号预处理系统中使用谐波峰值提取语音信号的包络信息的处理的流程图;
图6A至图6C是用于解释根据本发明的如何获得次要谐波峰值的参考图;
图7是示出根据本发明的在语音信号预处理系统中使用谐波峰值确定语音信号是浊音还是清音的处理的流程图;
图8是示出根据本发明的在图7所示的处理中使用第二神经网络的情况的流程图;
图9是示出根据本发明的语音信号预处理系统的形态学分析处理的流程图,其中,使用形态学运算分析输入语音信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710079190.0/2.html,转载请声明来源钻瓜专利网。