[发明专利]一种用于失语症患者康复训练专用的语音识别方法有效

申请号：	202010242125.0	申请日：	2020-03-31
公开（公告）号：	CN111415652B	公开（公告）日：	2022-06-14
发明（设计）人：	唐以廷;李有存;方强;穆罕默德	申请（专利权）人：	汕头大学
主分类号：	G10L15/01	分类号：	G10L15/01;G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L25/03;G10L25/66
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	周增元;曹江
地址：	515000 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于失语症患者康复训练专用语音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于失语症患者康复训练专用的语音识别方法，其特征在于，包括以下步骤：

步骤1：录制包含失语症患者和健康被试者的语音材料；

步骤2：使用MATLAB函数audioDatastore读取语音信号，获得语音标签和采样率，所述语音标签的形式为n*1向量，n为语音信号个数；获取时域特征，检测所述语音信号中的时域波形图，设置幅度阈值LCThreshold为0.05，提取语音信号的过零率；使用MATLAB函数F_pitch计算出语音的基音频率；获取频域特征，检测语音信号的频谱图及其包络，提取包络的前三个峰值；获取倒谱域特征，使用MATLAB函数mfcc计算出语音的倒谱域特征，其中梅尔倒谱系数的第一维使用信号能量的对数值替代；获取图像特征，使用短时傅里叶变换将语音信号转换成具有时频域特征的语谱图，使用MATLAB函数regionprops检测语音的图像特征；将时域特征、频域特征、倒谱域特征、图像特征放入n*51的特征矩阵中，其中n表示语音信号的个数，51表示语音信号的特征维度；所述特征矩阵的大小为n*51，其中n为语音信号个数，51为信号特征维度，包括2维时域特征、3维频域特征、39维倒谱域特征、7维图像特征；

步骤3：使用特征选择确认使用所述特征矩阵得到最优结果；

步骤4：在将所述特征矩阵输入机器学习算法支持向量机训练语音识别模型之前，进行z-score数据标准化处理；

步骤5：将所述特征矩阵输入机器学习算法支持向量机中进行学习，构建出用于失语症患者言语康复的语音识别模型；

步骤6：将待识别语音转换为所述特征矩阵，使用所述语音识别模型预测识别结果。

2.根据权利要求1所述的用于失语症患者康复训练专用的语音识别方法，其特征在于，所述步骤5将所述特征矩阵输入机器学习算法支持向量机中进行学习的步骤包括：

步骤5.1：使用MATLAB函数templateSVM创建一个默认的SVM模板t；

步骤5.2：在多分类学习器fitcecoc中输入步骤2的所述语音标签和特征矩阵，设置交叉验证折数为5折，训练出所述语音识别模型。

3.根据权利要求2所述的用于失语症患者康复训练专用的语音识别方法，其特征在于，所述步骤3使用特征选择的步骤包括：

将步骤2中的所述语音标签和特征矩阵导入MATLAB的快速分类学习器ClassificationLearner中，通过手动自由选择特征组合，最终确认使用步骤2所述特征矩阵得到最优结果。

4.根据权利要求3所述的用于失语症患者康复训练专用的语音识别方法，其特征在于，所述步骤4进行z-score数据标准化处理的步骤包括：

将所述特征矩阵按列求取均值x_j和标准差s_j，然后根据公式z_ij=（x_ij－x_j）/s_j计算得出标准化后的数值，其中，x_ij为特征矩阵中的原始值。

5.根据权利要求1-4任一项所述的用于失语症患者康复训练专用的语音识别方法，其特征在于，所述语音信号的内容为中国康复研究中心标准失语症检查表中的关键词汇。