[发明专利]语音特征提取方法、装置、电子设备和存储介质有效
申请号: | 202010307618.8 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111540367B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 杨帆;方磊;方四安 | 申请(专利权)人: | 合肥讯飞数码科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18;G10L15/02;G10L15/00;G10L15/26;G10L15/16;G10L15/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 特征 提取 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种语音特征提取方法、装置、电子设备和存储介质,其中方法包括:确定语音数据;将所述语音数据输入至语音特征提取模型中,得到所述语音特征提取模型输出的语音特征;其中,所述语音特征提取模型是基于样本语音数据无监督训练得到的;所述语音提取模型用于将所述语音数据编码得到隐层特征,并将所述隐层特征进行非线性空间映射,得到所述语音特征。本发明实施例提供的方法、装置、电子设备和存储介质,对语音数据进行编码即可实现针对语音数据的隐层特征的深度挖掘和表达,对隐层特征进行非线性空间映射即可优化语音特征对于语音数据的拟合效果,且节省了大量计算,避免了由于人为降维带来的高维特征损失。
技术领域
本发明涉及智能语音技术领域,尤其涉及一种语音特征提取方法、装置、电子设备和存储介质。
背景技术
智能语音技术作为人工智能重要的组成部分,其应用通过标注大量的有监督数据,重新训练语音模型或者在原始语音模型上进行优化,其过程会消耗大量的人力和时间成本。特别地,在一些特殊行业,受限于行业的机密性,无法利用互联网平台进行大规模的标注工作。因此,无监督的语音特征提取方法应用而生。
目前无监督的语音特征提取方法主要包括主成分分析方法和基于混合高斯模型的方法两种,上述两种方法的设置前提均是语音数据服从高斯分布,且在执行过程中仅需要进行人为降维,然而语音数据不一定符合高斯分布,且人为降维会无可避免地导致高维特征的损失,这些都导致语音特征的无监督提取偏离真实情况,影响后续语音识别、说话人识别、语种识别等应用的可靠性和准确性。
发明内容
本发明实施例提供一种语音特征提取方法、装置、电子设备和存储介质,用以解决现有的无监督语音特征提取的准确性和可靠性低的问题。
第一方面,本发明实施例提供一种语音特征提取方法,包括:
确定语音数据;
将所述语音数据输入至语音特征提取模型中,得到所述语音特征提取模型输出的语音特征;
其中,所述语音特征提取模型是基于样本语音数据无监督训练得到的;所述语音提取模型用于将所述语音数据编码得到隐层特征,并将所述隐层特征进行非线性空间映射,得到所述语音特征。
优选地,所述将所述语音数据输入至语音特征提取模型中,得到所述语音特征提取模型输出的语音特征,具体包括:
将所述语音数据输入至所述语音特征提取模型的隐层特征提取层,得到所述隐层特征提取层输出的隐层特征;
将所述隐层特征输入至所述语音特征提取模型的空间映射层,得到所述空间映射层输出的语音特征。
优选地,所述语音特征提取模型是基于同一正向语音数据对中两个样本语音数据的样本语音特征之间的相关性,和/或不同正向语音数据对中样本语音数据的样本语音特征之间的差异性训练得到的;
任一正向语音数据对中两个样本语音数据分别为原始语音数据和增强语音数据,所述增强语音数据是对所述原始语音数据进行数据增强得到的。
优选地,所述语音特征提取模型的损失函数是基于每一样本语音数据的对内特征相似度和对间特征相似度确定的;
其中,任一样本语音数据的对内特征相似度为所述任一样本语音数据的样本语音特征与所属正向语音数据对中另一样本语音数据的样本语音特征之间的相似度,所述任一样本语音数据的对间特征相似度为所述任一样本语音数据的样本语音特征与所属正向语音数据对之外的每一样本语音数据的样本语音特征之间的相似度。
优选地,所述语音特征提取模型的损失函数是基于每一样本语音数据的单样本损失函数确定的;
其中,任一样本语音数据的单样本损失函数是基于所述任一样本语音数据的对内特征得分与整体特征得分的比值确定的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010307618.8/2.html,转载请声明来源钻瓜专利网。