[发明专利]一种帕金森语音分类方法及系统、存储介质及终端在审
申请号: | 202011609141.5 | 申请日: | 2020-12-30 |
公开(公告)号: | CN114694677A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 刘子琪;刘立庄;韩振奇;赵丹 | 申请(专利权)人: | 中国科学院上海高等研究院 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/66 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 201210 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 帕金森 语音 分类 方法 系统 存储 介质 终端 | ||
本发明提供一种帕金森语音分类方法及系统、存储介质及终端,包括以下步骤:获取语音信号对应的MFCC,并基于所述MFCC构建MFCC特征图;对所述MFCC特征图进行共振峰特征判定;对所述共振峰特征判定结果进行深度学习,获取所述语音信号的帕金森语音分类结果。本发明的帕金森语音分类方法及系统、存储介质及终端基于共振峰聚类和MFCC特征图,通过深度学习实现帕金森语音分类,准确度高,实用性强。
技术领域
本发明涉及深度学习的技术领域,特别是涉及一种帕金森语音分类方法及系统、存储介质及终端。
背景技术
帕金森疾病是中老年人的常见病,患者表现为中枢神经系统的器质性损害。嗓音作为人类大脑、神经系统及多种发声器官共同作用的结果,与人的健康状况息息相关,大约90%的帕金森患者会出现语音方面的构音障碍,并且这个构音障碍往往在帕金森患者被确诊之前就会出现。因此,近年来出现了大量基于语音的帕金森诊断的研究。
近年来,随着深度学习算法飞速发展,其广泛应用于帕金森病的语音分类。现有技术中建立了许多帕金森病的数据集,如帕金森病分类数据集(PDCD),其将基频参数、谐波参数、重复周期密度熵(Recurrence Period Density Entropy,RPDE)、去渲染波动分析(Detrended fluctuation analysis,DFA)和基音周期熵(Pitch Period Entropy,PPE)视为基准特征并且设计出可调Q因子小波变换(tunable Q-factor wavelet transform,TWQT)特征。以Athanasios Tsanas博士为代表,Peker采用了基于声音特征和神经网络的方法,准确率达到98.1%。Guruler采用了基于聚类加权和复值神经网络的方法,即复值人工神经网络(CVANN),准确率达到99.5%。然而,由于每个受试者在数据集中有多个重复的语音记录,这些方法会导致实验结果的偏差。使用层叠波尔兹曼机组成深度神经网络的方法被称为深度信念网络,该网络常用于对于低维度上难以分离的数据进行分类。16年提出的应用于帕金森语音分类的深度信念网络同样也达到了较好效果。19年Yunus Korkmaz提出了基于遗传算法的元音分类,该数据集还是在小数据集上达到了接近100%的准确率。然而,虽然有许多基于元音的帕金森语音分类问题方面的研究,但是这些研究所基于的数据集,往往样本量很小。所得的实验结果很容易在小数据集上出现过拟合的现象,从而在实际情况下不能很好地发挥作用。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种帕金森语音分类方法及系统、存储介质及终端,基于共振峰聚类和Mel频率倒谱系数(Mel Frequency CepstrumCoefficient,MFCC)特征图,通过深度学习实现帕金森语音分类,准确度高,实用性强。
为实现上述目的及其他相关目的,本发明提供一种帕金森语音分类方法,包括以下步骤:获取语音信号对应的MFCC,并基于所述MFCC构建MFCC特征图;对所述MFCC特征图进行共振峰特征判定;对所述共振峰特征判定结果进行深度学习,获取所述语音信号的帕金森语音分类结果。
于本发明一实施例中,基于所述MFCC构建MFCC特征图包括以下步骤:
将所述MFCC的14个特征值在所述语音信号各时间点上的均值在二维坐标轴上进行描点,并用平滑曲线连接;
将所述MFCC的14个特征值在所述语音信号各时间点上的标准差在所述二维坐标轴上进行描点,并用平滑曲线连接。
于本发明一实施例中,所述MFCC的14个特征包括log_energy参数和0阶到12阶系数。
于本发明一实施例中,对所述MFCC特征图进行共振峰特征判定包括以下步骤:
获取共振峰参数;
基于所述共振峰参数对所述MFCC特征图进行共振峰特征判定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海高等研究院,未经中国科学院上海高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011609141.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于燃料电池车的宽频消声器
- 下一篇:一种环保型标签材料