[发明专利]一种低比特变速率语言编码器无效

申请号：	200410103220.3	申请日：	2004-12-31
公开（公告）号：	CN1632862A	公开（公告）日：	2005-06-29
发明（设计）人：	董恩清	申请（专利权）人：	苏州大学
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/02
代理公司：	苏州创元专利商标事务所有限公司	代理人：	陶海锋
地址：	215006江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种适合于要求低比特变速率语音编码的通信系统中的语音编码器。它将SVM方法应用于VAD语音激活检测中，提高了语音编码器对语音检测的正确识别率；采用GSM的语音模式分类方法，将原来的四种语音模式合并为三种语音模式，使最终只采用两个比特表示整个语音模式。它还充分利用局部余弦变换具有较高的编码增益的特点，采用LCT和SVM－VAD进行低比特变速率语音编码，提供了一个实用的、性能优良的低比特变速率语音编码器。
搜索关键词：	一种比特速率语言编码器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种低比特变速率语音编码器，将输入的原始语音信号经过高通滤波器预处理后，输入到语音激活检测器检测判别激活语音与非激活语，再分别经局部余弦变换器处理，完成语音编码，其特征在于：所述的语音激活检测器采用支持向量机—语音激活检测模块，其工作流程如下：①对输入的语音数据进行参数提取，得到当前帧的线谱频率、全带能量、低带能量、过零率四个分类特征参数；②初始化处理：根据背景噪声的改变随时计算更新在只有背景噪声时上述四个特征参数；③差分处理：将上述当前帧的四个特征参数分别减去初始化时表示当前状态只有背景噪声的情况下相应的这四个特征参数，生成语音激活检测分类需要的相应的四个差分特征参数；④采用支持向量机算法进行语音激活性检测，训练支持向量机采用的是序列最小最优化方法，最终将语音划分成激活和非激活两种语音类型；⑤采用四步平滑和校正算法进行语音激活检测判别平滑处理；⑥在每一帧进行语音激活检测处理后，输出非激活或激活语音帧信号，如果对估计该帧的背景噪声能量大于背景噪声能量门限的，则需要重新再进行修正平均背景噪声参数处理；所述的局部余弦变换器处理，其方法是：①对经支持向量机—语音激活检测模块检测为非激活语音帧，按无声/背景噪声语音模式的分维矢量维数进行分维处理，然后将该分维矢量分别按照无声/背景噪声语音模式的相应分维矢量的码书进行分维矢量量化，得到与该语音模式相对应的两个比特位长度都是7位的分维矢量量化结果，同时对该模式语音帧的增益进行标量量化，将按照表示语音模式的2个比特位、表示增益的8个比特位、表示第一分维矢量和第二分维矢量的都为7比特位的顺序，组成3个字节输出，表示该帧语音编码结束；②对经支持向量机—语音激活检测模块检测为激活语音帧，按清音、清浊音、中强浊音的方法分成三种语音模式，按照相应的三种语音模式的分维矢量维数进行分维处理，然后将相应的四个分维矢量分别按照对应的语音模式的相应分维矢量的码书进行分维矢量量化，得到与该语音模式相对应的四个不同长度比特位分别表示对应的分维矢量的量化结果；同时对该语音帧的增益进行标量量化，将按照表示语音模式的两个比特位、表示增益的8个比特位及按照从表示该语音模式的第一分维矢量的比特位至第四分维矢量的比特位的顺序将这些比特位组成整数个字节输出，表示该帧语音编码结束。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州大学，未经苏州大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200410103220.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种低比特变速率语言编码器无效

专利文献下载