[发明专利]一种声纹鉴权训练方法及系统在审

专利信息
申请号: 201811336977.5 申请日: 2018-11-12
公开(公告)号: CN109243466A 公开(公告)日: 2019-01-18
发明(设计)人: 毛海涛;鲍捷;吕春;王明;阴陶;戴荣 申请(专利权)人: 成都傅立叶电子科技有限公司
主分类号: G10L17/04 分类号: G10L17/04;G10L17/18;G10L17/02
代理公司: 成都诚中致达专利代理有限公司 51280 代理人: 曹宇杰
地址: 610041 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种声纹鉴权训练方法及系统,方法包括:加载音频配置文件,对训练需要的音频文件及标准文件进行数据配置和确认;加载训练模型参数;构建基于神经网络的训练模型,作为语音识别的训练特征,并完成模型加载;将完成的配置数据加载输入训练模型;进行模型训练:使用HE来初始化神经网络的权重;训练后输入SOFTMax分类器进行处理,通过ResCNN进行神经网络训练;通过余弦相似性实现三元组损失函数进行训练评估;基于归一化处理数据评估的标准;生成声纹识别的声纹库并保存。系统包括音频配置模块、参数加载模块、模型构建模块、数据输入模块、模型训练模块、存储模块。识别精度高达到94.45%,相比于传统的i‑vector方法,准确率提高了近30%。
搜索关键词: 训练模型 加载 声纹 神经网络 鉴权 模型构建模块 模型训练模块 神经网络训练 数据输入模块 归一化处理 余弦相似性 标准文件 参数加载 存储模块 模型加载 模型训练 配置数据 配置文件 声纹识别 数据配置 数据评估 损失函数 训练评估 训练特征 音频配置 音频文件 语音识别 初始化 传统的 分类器 三元组 准确率 构建 权重 保存
【主权项】:
1.一种声纹鉴权训练方法,其特征在于,包括以下步骤:S1、加载音频配置文件,对训练需要的音频文件及标准文件进行数据配置和确认;S2、加载训练模型参数;S3、构建基于神经网络的训练模型,作为语音识别的训练特征,并完成模型加载;S4、将S1完成的配置数据加载输入训练模型;S5、进行模型训练:S51、通过预训练来初始化神经网络的权重,S52、通过分类器进行处理,S53、通过余弦相似性的三元组损失函数进行评估,S54、通过归一化处理使评估数据标准化;S6、生成声纹识别的声纹库并保存。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都傅立叶电子科技有限公司,未经成都傅立叶电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811336977.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top