[发明专利]一种声纹鉴权训练方法及系统在审

专利信息
申请号: 201811336977.5 申请日: 2018-11-12
公开(公告)号: CN109243466A 公开(公告)日: 2019-01-18
发明(设计)人: 毛海涛;鲍捷;吕春;王明;阴陶;戴荣 申请(专利权)人: 成都傅立叶电子科技有限公司
主分类号: G10L17/04 分类号: G10L17/04;G10L17/18;G10L17/02
代理公司: 成都诚中致达专利代理有限公司 51280 代理人: 曹宇杰
地址: 610041 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 训练模型 加载 声纹 神经网络 鉴权 模型构建模块 模型训练模块 神经网络训练 数据输入模块 归一化处理 余弦相似性 标准文件 参数加载 存储模块 模型加载 模型训练 配置数据 配置文件 声纹识别 数据配置 数据评估 损失函数 训练评估 训练特征 音频配置 音频文件 语音识别 初始化 传统的 分类器 三元组 准确率 构建 权重 保存
【说明书】:

一种声纹鉴权训练方法及系统,方法包括:加载音频配置文件,对训练需要的音频文件及标准文件进行数据配置和确认;加载训练模型参数;构建基于神经网络的训练模型,作为语音识别的训练特征,并完成模型加载;将完成的配置数据加载输入训练模型;进行模型训练:使用HE来初始化神经网络的权重;训练后输入SOFTMax分类器进行处理,通过ResCNN进行神经网络训练;通过余弦相似性实现三元组损失函数进行训练评估;基于归一化处理数据评估的标准;生成声纹识别的声纹库并保存。系统包括音频配置模块、参数加载模块、模型构建模块、数据输入模块、模型训练模块、存储模块。识别精度高达到94.45%,相比于传统的i‑vector方法,准确率提高了近30%。

技术领域

发明涉及生物识别技术,尤其涉及声纹识别,具体来说,尤其与一种利用深度学习方法的声纹鉴权训练方法及系统。

背景技术

传统的方法i-vector方法认为说话内容可以被分为两个部分,一个部分依赖于说话者和信道可变性,另一个部分依赖于其它的相关因素。i-vector声纹识别是一个多步过程,其涉及到使用不同说话者的数据来估计一个通用的背景模型,通常是高斯混合模型,收集充分的统计数据,提取i-vector,最后使用一个分类器来进行识别任务。传统的方法i-vector方法,业界的声纹识别率处于70%左右,且与文本相关。

发明内容

本发明提供一种与文本无关的声纹识别手段,具体是一种利用深度学习方法的声纹鉴权训练方法及系统,通过构建神经网络,使用SOFTMax分类和基于余弦相似性的三元组损失进行训练评估,识别精度高达到94.45%,相比于传统的i-vector方法,准确率提高了近30%。

本发明采用以下技术:

一种声纹鉴权训练方法,其特征在于,包括以下步骤:

加载音频配置文件,对训练需要的音频文件及标准文件进行数据配置和确认;

加载训练模型参数,参数包括训练集大小、训练的帧数和音频语谱图;

构建基于神经网络的训练模型,作为语音识别的训练特征,并完成模型加载;

将完成的配置数据加载输入训练模型;

进行模型训练:

通过预训练来初始化神经网络的权重,初始化采用HE初始化;

通过分类器进行处理,分类器采用sofmax多类分类器;

通过余弦相似性的三元组损失函数进行评估;

通过归一化处理使评估数据标准化,归一化采用L2-NOMARL;

生成声纹识别的声纹库并保存。

进一步,所述训练模型参数,包括训练集大小、训练的帧数和音频语谱图。

进一步,所述训练集大小,是每个训练样本对应一段语音的连续语谱图的时长。

进一步,所述音频语谱图,使用的是维度为(32,32,3)的伪图相。

进一步,所述神经网络为ResCNN神经网络的参数为:卷积块Conv 3×3、滤波器的尺寸3×3、两个方向上的零填充1、连续跨步1×1参数化。

一种声纹鉴权训练系统,其特征在于,包括:

音频配置模块,用于加载音频配置文件,对训练需要的音频文件及标准文件进行数据配置和确认;

参数加载模块,用于加载训练模型参数;

模型构建模块,用于构建基于神经网络的训练模型,作为语音识别的训练特征,并完成模型加载;

数据输入模块,用于将音频配置模块完成的配置数据加载输入训练模型;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都傅立叶电子科技有限公司,未经成都傅立叶电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811336977.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top