[发明专利]一种会议场景小样本条件下的声纹识别方法在审
申请号: | 202011038136.3 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112259107A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 张晖;赵梦;赵海涛;孙雁飞;朱洪波 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L17/06 | 分类号: | G10L17/06;G10L17/16;G10L17/02;G10L25/24 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 会议 场景 样本 条件下 声纹 识别 方法 | ||
本发明公开了一种会议场景小样本条件下的声纹识别方法,首先,对采集到的说话人语音进行预处理,提取梅尔频率倒谱系数MFCC及其一阶差分系数ΔMFCC和高斯频率倒谱系数GFCC及其一阶差分系数ΔGFCC;其次,利用高斯混合模型‑通用背景模型HMM‑UBM对语音信号进行时序建模,使用RVM学习得到每位说话人语音的分类信息;最后,通过对待识别人建立HMM模型,并将相关向量机RVM作为分类器进行判决决策得到分类结果。本发明大幅降低了识别算法的错误接收概率和错误拒绝概率,且不会影响用户信息安全。
技术领域
本发明属于智能会议领域,具体涉及一种基于会议场景小样本条件下的声纹识别方法。
背景技术
在会议场景下,由于会议安排时间大都非常紧凑,留给采集音频的时间很有限。其次,说话人主观上也不太愿意花费很长时间在采集音频上;再者,被采集语音的说话人也无法在短期时间内,将自己的声纹特征全都展现出来,因此很难在会议场景下采集到足够的训练样本。大多数情况下,采集到的语音大都是同--种腔调,无法完全展示说话人的声纹特征,无法完全囊括不同条件下说话人自身的差异特征。不仅在会议场景下,在其他场景下也是如此,根本无法完成采集足够样本的需求,这将直接导致了声纹识别系统中只能使用小样本完成模型的训练。
在声纹识别系统中采用小样本训练模型,将带来很多难以预想的问题:首先,样本点少,无法完全覆盖用户的声纹个性特征,从而,小样本下提取的特征将很难区分出不同的说话人,这将直接导致识别准确率低的问题;再者,小样本训练时,样本缺失将导致模型很难收敛,无法达到训练出能完整描述声纹特征分布模型的目标;此外,小样本条件下训练出的模型会偏离正确的声纹特征分布,无法达到最优的处理结果,还有可能带来非常严重的过拟合现象;除此之外,样本点少,将严重限制声纹识别技术的作用领域,由于样本点的不足,在多人声纹识别领域,系统所能区分的总人数非常有限,这将严重降低用户对声纹识别系统的使用体验。
目前,语音识别系统常采用高斯混合模型-通用背景模型(GMM-UBM),应用话者声道信息并通过全局背景模型解决训练样本少的问题。此外随着人工智能网络(ANN)、支持向量机(SVM)等机器学习方法的不断成熟,也出现类似GMM-SVM的融合算法。而ANN是一个高度非线性的大型网络,需要大量的训练样本才能得到效果较好的模型,导致其难以应用于实际。
发明内容
发明目的:为克服以上技术问题本发明提出一种会议场景小样本条件下的声纹识别方法,大幅降低了识别算法的错误接收概率和错误拒绝概率。
发明内容:本发明提供一种会议场景小样本条件下的声纹识别方法,具体包括以下步骤:
(1)对采集到的说话人语音进行预处理,提取梅尔频率倒谱系数及其一阶差分系数和高斯频率倒谱系数及其一阶差分系数共振峰;
(2)利用HMM-UBM对语音信号进行时序建模,使用RVM学习得到每位说话人语音的分类信息;
(3)通过对待识别人建立HMM模型,并将RVM作为分类器进行判决决策得到分类结果。
进一步地,所述步骤(1)包括以下步骤:
(11)对语音信息进行采样量化、DFT操作后通过Mel频率滤波器组,然后取对数,DCT求倒谱得到MFCC参数,并求得其一阶差分倒谱系数;
(12)对语音信号进行快速傅里叶变换,取绝对值后通过Gammatone滤波器组,取对数后进行离散傅里叶变换求得GFCC参数,并求得其一阶差分倒谱系数;
(13)混合特征参数,将MFCC、ΔMFCC、GFCC、ΔGFCC作为混合特征参数;
(14)采用线性判别分析LDA进行特征转换,实现数据降维,使新特征更具区分性。
进一步地,步骤(2)所述的时序建模过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011038136.3/2.html,转载请声明来源钻瓜专利网。