[发明专利]基于分形特征的智能轮椅语音识别控制方法及系统无效
| 申请号: | 201110109168.2 | 申请日: | 2011-04-28 |
| 公开(公告)号: | CN102184732A | 公开(公告)日: | 2011-09-14 |
| 发明(设计)人: | 张毅;罗元;李敏;蔡军;谢颖;林海波;黄璜;李艳花 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04 |
| 代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
| 地址: | 400065*** | 国省代码: | 重庆;85 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征 智能 轮椅 语音 识别 控制 方法 系统 | ||
1.基于分形特征的智能轮椅语音识别控制方法,其特征在于:包括以下步骤:
S1:语音信号命令词输入;
S2:对语音信号进行预处理;
S3:提取经过预处理后语音信号的特征参数;
S4:将特征参数与模板库的模板进行模式匹配;
S5:选择匹配相似度最高的模板作为识别结果;
S6:将该识别结果转换成智能轮椅的运动命令;
S7:调用相应的控制函数,驱动智能轮椅按照语音信号进行运动。
2.根据权利要求1所述的基于分形特征的智能轮椅语音识别控制方法,其特征在于:所述步骤S2中的预处理,包括语音的预加重滤波、加窗分帧处理与双门限端点检测。
3.根据权利要求1所述的基于分形特征的智能轮椅语音识别控制方法,其特征在于:所述步骤S3中的特征提取包括以下步骤:
S31:提取语音信号的Mel频率倒谱系数MFCC参数;
S311:首先确定每一帧语音采样序列的点数,对每帧序列s(n)进行预加重滤波处理;
S312:再进行离散傅立叶变换FFT变换,取模的平方得到离散功率谱S(n);
S313:在语音的频谱范围内设置若干个带通滤波器;在某一频谱范围内的语音可以通过此带通滤波器,而其它范围的语音频谱被衰减至极低值。此带通滤波器如下:
Hm(n),m=0,1,·,M-1,n=0,1,·,N/2-1
其中Hm(n)为每个带通滤波器的传递函数,M为滤波器的个数,通常取24,N为一帧语音信号的点数;
S314:将离散功率谱转换为Mel频率下的功率谱S(n);
计算S(n)通过M个Hm(n)后所得的功率值,即计算S(n)和Hm(n)在各离散频率点上乘积之和,得到M个参数Pm,m=0,1,·,M-1,此处Pm为中心频率;
S315:计算Pm的自然对数,得到Lm,m=0,1,·,M-1,此处Lm为对数频谱。
S316:对L0,L1,·,Lm-1计算其离散余弦变换,得到Dm,m=0,1,·,M-1;
S317:舍去代表直流成分的D0,取D1,D2,·,DK作为MFCC参数;
S32:提取语音的动态特征,作为一帧语音信号的特征参数,
用差分倒谱参数来描述语音的动态特征,计算公式为:
其中c和d都表示一帧语音参数,k为常数,通常取2,差分参数就称为当前帧的前两帧和后两帧参数的线性组合;由此式计算得到的差分参数为一阶MFCC差分参数,实际使用中,将MFCC参数和各阶MFCC差分参数合并为一个矢量;
S33:提取语音信号的分形维数作为分形特征;
S331:将语音信号归一化到单位正方形区域,得到归一化信号x(t);
S332:将正方形区域划分为边长为s的网格,计算出logN(s),log(1/s),N(s)表示用边长为s的网格覆盖x(t)所需要的最小正方形个数,改变s的大小,计算相应的logN(s),log(1/s);
S 333:令xi=log(1/si),yi=logN(si),i=1,2,·,M,利用(xi,yi)最小二乘拟合直线y=kx+b,k即为计盒维数DB,DB的计算公式为:
语音信号的分形特征由分形维数来定量表征;由此求出语音信号的分形特征值作为语音信号的特征参数;
S34:提取混合特征参数,
将分形维数DB和一阶MFCC差分参数合并到MFCC参数中组成混合的特征参数MFCC+ΔMFCC+D;
其中,ΔMFCC为一阶MFCC差分参数,D为分形维数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110109168.2/1.html,转载请声明来源钻瓜专利网。





