[发明专利]一种帕金森病语音样本段多类型重构变换方法有效
申请号: | 202110761463.X | 申请日: | 2021-07-06 |
公开(公告)号: | CN113393932B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 李勇明;刘承宇;王品;张小恒;李新科 | 申请(专利权)人: | 重庆大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G10L15/08;G06K9/62 |
代理公司: | 重庆敏创专利代理事务所(普通合伙) 50253 | 代理人: | 陈千 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 帕金森病 语音 样本 类型 变换 方法 | ||
本发明涉及语音分类技术领域,具体公开了一种帕金森病语音样本段多类型重构变换方法,首先,设计重构算子对原始数据样本段进行变换,从而得到第一目标数据集;其次,考虑到样本间的差异性,对原始数据集进行聚类重构,得到第二目标数据集;再次,利用聚类重构的新样本段集对聚类后的数据样本集进行卷积处理,得到第三目标数据集;最后,基于这三个新数据集分别训练子分类器,然后对分类结果进行决策加权融合。本发明提出了基于多类型重构和聚类算法的PD语音样本变换算法,有效获得高质量新样本,从而提高识别准确率。实验结果表明本方法构建的三个新样本数据集都比变换前的原数据集具有较高的准确率。
技术领域
本发明涉及语音分类技术领域,尤其涉及一种帕金森病语音样本段多类型重构变换方法。
背景技术
帕金森病(Parkinson’s disease,PD)是一种中枢神经系统的神经退行性疾病。目前PD尚无完全治愈或预防方法,但可以通过早期诊断和治疗来加以控制。构音障碍是PD的早期重要征兆,因此基于机器学习的PD语音识别算法研究对PD早期诊断非常重要。
目前相关方法主要关注在特征学习和分类器设计方面,虽然有利于提高分类准确率,但难以解决PD语音样本问题,因此准确性的提高有限。PD语音样本质量主要体现在以下几方面:1)由于受试者病变程度不一、采集设备和环境流程等原因,语音样本反映疾病的能力不一。2)同一受试者的不同语音样本段含语料不同(元音、字、词、句等),由于不同语料与PD构音障碍关联性不一,因此语音样本与疾病类别标签相关性不一。3)语音样本还存在非均衡性、类重叠性等问题。这些样本质量问题阻碍了PD语音识别性能的进一步提升。
样本段选择可以在现有样本中获得高质量样本,从而提升样本集质量,如考虑稀疏邻域的非平衡数据集的样本选择、重复剪辑近邻法等。但是,该类方法仅局限在现有样本集中,无法重构新样本,从而限制了其提高样本质量的性能潜力。近年来,有学者尝试研究对PD语音样本进行变换来获得高质量新样本,显著提高了准确率。但是,这一方法仅能对单个病人所有样本进行线性重构,并未考虑其它重构方法,且未对样本进行区别处理,因此变换后的新样本的质量仍有待提高。
发明内容
本发明提供一种帕金森病语音样本段多类型重构变换方法,解决的技术问题在于:如何提升样本段质量,以提升PD语音识别性能。
为解决以上技术问题,本发明提供一种帕金森病语音样本段多类型重构变换方法,包括步骤:
S1:对原始数据集S中各个受试者的样本段S~i使用重构算子进行重构,得到第一目标数据集Ef;
S2:对原始数据集S中各个受试者的样本段S~i进行迭代式均值聚类,得到聚类数据集Y;
S3:对聚类数据集Y使用所述重构算子进行重构,得到第二目标数据集Es;
S4:对聚类数据集Y和第二目标数据集Es使用卷积算子进行卷积,得到第三目标数据集Et;
S5:基于所述第一目标数据集Ef、所述第二目标数据集Es、所述第三目标数据集Et,对三个子分类器进行训练及测试,训练时对各子分类器的分类结果做加权融合。
进一步地,在所述步骤S1和所述步骤S3中,所述重构算子用于计算样本的均值、中位数、25%裁剪均值、标准差、四分位距离和平均绝对误差。
进一步地,原始数据集其中的各个样本G表示S的总样本数,N表示每个样本的特征数;L表示受试者人数;表示各个受试者的样本段包括G0=G/L个样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110761463.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有电动升降机构的儿童学习桌
- 下一篇:一种航空发动机转速测量方法及装置