[发明专利]一种面向语音识别的特征迁移学习方法及系统有效
| 申请号: | 202210427775.1 | 申请日: | 2022-04-22 |
| 公开(公告)号: | CN114997266B | 公开(公告)日: | 2023-07-11 |
| 发明(设计)人: | 张晓俊;章溢华;钱金阳;许宜申;陶智 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/21;G06F18/22;G06N20/00 |
| 代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 朱振德 |
| 地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 语音 识别 特征 迁移 学习方法 系统 | ||
本发明公开了一种面向语音识别的特征迁移学习方法及系统,包括以下步骤:获取制作为训练集和测试集;计算训练集和测试集的特征边缘分布差异和特征间条件分布差异;建立特征分布差异目标,求解一个映射矩阵,使得训练集和测试集映射到同一子空间上的特征分布差异尽可能小;其中,特征分布差异目标以最小化训练集和测试集的特征边缘分布差异和特征间条件分布差异为基础,将类内距、类间距和图嵌入矩阵作为正则项,使得映射后不同类别的样本的中心投影点之间的距离尽可能地大,同一类别的样本投影后距离应尽可能地小,且保持邻域间样本的相似关系作为分布差异约束。本发明有效减少各种不确定因素对语音信号的干扰,从而提升语音识别率。
技术领域
本发明涉及语音识别技术领域,具体涉及一种面向语音识别的特征迁移学 习方法及系统。
背景技术
语音的识别过程主要包括特征提取和利用分类器进行识别两个步骤。在特 征提取方面,常用的特征参数主要包含线性预测倒谱系数LPCC、Mel倒谱 MFCC、基频F0、能量、Fourier倒谱以及相应的动态特征参数等。同时由于环 境差异、噪声、说话人等多种不确定因素造成的特征差异,往往会影响特征的 在分类中的性能表现。
为了消除特征差异,通常采用机器学习及特征筛选的方法,但语音识别率 效果低,容易被噪声等因素影响,进一步地,现有识别系统采用迁移学习方法 来消除特征差异,但其往往只考虑了数据集之间的边缘分布和条件分布,忽略 了伪标签的不稳定性和标签的保留性,造成最终识别率不够准确可靠。
发明内容
本发明的目的是提供一种面向语音识别的特征迁移学习方法及系统,有效 减少各种不确定因素对语音信号的干扰,从而提升语音识别率。
为了解决上述技术问题,本发明提供了一种面向语音识别的特征迁移学习 方法,包括以下步骤:
S1、获取语音信号数据,并将其分别制作为训练集和测试集,其中,训练 集中的语音信号数据具有表示语音类别的标签;
S2、利用最大均值差异计算训练集和测试集的特征边缘分布差异;
S3、通过训练集训练一组分类器,将测试集输入该分类器获得测试集的伪 标签,利用伪标签计算训练集与测试集的特征间条件分布差异;
S4、建立特征分布差异目标,求解一个映射矩阵,使得训练集和测试集映 射到同一子空间上的特征分布差异尽可能小;
其中,所述特征分布差异目标包括:以最小化训练集和测试集的特征边缘 分布差异和特征间条件分布差异为基础,将类内距、类间距和图嵌入矩阵作为 正则项,使得训练集和测试集映射后不同类别的样本的中心投影点之间的距离 尽可能地大,同一类别的样本投影后距离应尽可能地小,且保持邻域间样本的 相似关系作为分布差异约束。
作为本发明的进一步改进,所述步骤S2具体表示为:
其中,M0为边缘分布差异后的MMD矩阵,ns、nt分别表示训练集与测试 集包含的语音数目,A为映射矩阵。
作为本发明的进一步改进,将训练集和测试集的特征边缘分布差异和特征 间条件分布差异结合:
其中,c表示语音样本的类别,分别表示训练集与测试集中同属第c 类的语音样本数目;为计算条件分布差异后得到的MMD矩 阵。
作为本发明的进一步改进,以训练集和测试集的特征边缘分布差异和特征 间条件分布差异的结合为基础,建立特征分布差异的目标函数:
其中,为正则项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210427775.1/2.html,转载请声明来源钻瓜专利网。





