[发明专利]一种用于失语症患者康复训练专用的语音识别方法有效
申请号: | 202010242125.0 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111415652B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 唐以廷;李有存;方强;穆罕默德 | 申请(专利权)人: | 汕头大学 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L25/03;G10L25/66 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 周增元;曹江 |
地址: | 515000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 失语症 患者 康复训练 专用 语音 识别 方法 | ||
1.一种用于失语症患者康复训练专用的语音识别方法,其特征在于,包括以下步骤:
步骤1:录制包含失语症患者和健康被试者的语音材料;
步骤2:使用MATLAB函数audioDatastore读取语音信号,获得语音标签和采样率,所述语音标签的形式为n*1向量,n为语音信号个数;获取时域特征,检测所述语音信号中的时域波形图,设置幅度阈值LCThreshold为0.05,提取语音信号的过零率;使用MATLAB函数F_pitch计算出语音的基音频率;获取频域特征,检测语音信号的频谱图及其包络,提取包络的前三个峰值;获取倒谱域特征,使用MATLAB函数mfcc计算出语音的倒谱域特征,其中梅尔倒谱系数的第一维使用信号能量的对数值替代;获取图像特征,使用短时傅里叶变换将语音信号转换成具有时频域特征的语谱图,使用MATLAB函数regionprops检测语音的图像特征;将时域特征、频域特征、倒谱域特征、图像特征放入n*51的特征矩阵中,其中n表示语音信号的个数,51表示语音信号的特征维度;所述特征矩阵的大小为n*51,其中n为语音信号个数,51为信号特征维度,包括2维时域特征、3维频域特征、39维倒谱域特征、7维图像特征;
步骤3:使用特征选择确认使用所述特征矩阵得到最优结果;
步骤4:在将所述特征矩阵输入机器学习算法支持向量机训练语音识别模型之前,进行z-score数据标准化处理;
步骤5:将所述特征矩阵输入机器学习算法支持向量机中进行学习,构建出用于失语症患者言语康复的语音识别模型;
步骤6:将待识别语音转换为所述特征矩阵,使用所述语音识别模型预测识别结果。
2.根据权利要求1所述的用于失语症患者康复训练专用的语音识别方法,其特征在于,所述步骤5将所述特征矩阵输入机器学习算法支持向量机中进行学习的步骤包括:
步骤5.1:使用MATLAB函数templateSVM创建一个默认的SVM模板t;
步骤5.2:在多分类学习器fitcecoc中输入步骤2的所述语音标签和特征矩阵,设置交叉验证折数为5折,训练出所述语音识别模型。
3.根据权利要求2所述的用于失语症患者康复训练专用的语音识别方法,其特征在于,所述步骤3使用特征选择的步骤包括:
将步骤2中的所述语音标签和特征矩阵导入MATLAB的快速分类学习器ClassificationLearner中,通过手动自由选择特征组合,最终确认使用步骤2所述特征矩阵得到最优结果。
4.根据权利要求3所述的用于失语症患者康复训练专用的语音识别方法,其特征在于,所述步骤4进行z-score数据标准化处理的步骤包括:
将所述特征矩阵按列求取均值xj和标准差sj,然后根据公式zij=(xij-xj)/sj计算得出标准化后的数值,其中,xij为特征矩阵中的原始值。
5.根据权利要求1-4任一项所述的用于失语症患者康复训练专用的语音识别方法,其特征在于,所述语音信号的内容为中国康复研究中心标准失语症检查表中的关键词汇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汕头大学,未经汕头大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010242125.0/1.html,转载请声明来源钻瓜专利网。