[发明专利]一种声纹鉴权训练方法及系统在审
申请号: | 201811336977.5 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109243466A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 毛海涛;鲍捷;吕春;王明;阴陶;戴荣 | 申请(专利权)人: | 成都傅立叶电子科技有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/18;G10L17/02 |
代理公司: | 成都诚中致达专利代理有限公司 51280 | 代理人: | 曹宇杰 |
地址: | 610041 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种声纹鉴权训练方法及系统,方法包括:加载音频配置文件,对训练需要的音频文件及标准文件进行数据配置和确认;加载训练模型参数;构建基于神经网络的训练模型,作为语音识别的训练特征,并完成模型加载;将完成的配置数据加载输入训练模型;进行模型训练:使用HE来初始化神经网络的权重;训练后输入SOFTMax分类器进行处理,通过ResCNN进行神经网络训练;通过余弦相似性实现三元组损失函数进行训练评估;基于归一化处理数据评估的标准;生成声纹识别的声纹库并保存。系统包括音频配置模块、参数加载模块、模型构建模块、数据输入模块、模型训练模块、存储模块。识别精度高达到94.45%,相比于传统的i‑vector方法,准确率提高了近30%。 | ||
搜索关键词: | 训练模型 加载 声纹 神经网络 鉴权 模型构建模块 模型训练模块 神经网络训练 数据输入模块 归一化处理 余弦相似性 标准文件 参数加载 存储模块 模型加载 模型训练 配置数据 配置文件 声纹识别 数据配置 数据评估 损失函数 训练评估 训练特征 音频配置 音频文件 语音识别 初始化 传统的 分类器 三元组 准确率 构建 权重 保存 | ||
【主权项】:
1.一种声纹鉴权训练方法,其特征在于,包括以下步骤:S1、加载音频配置文件,对训练需要的音频文件及标准文件进行数据配置和确认;S2、加载训练模型参数;S3、构建基于神经网络的训练模型,作为语音识别的训练特征,并完成模型加载;S4、将S1完成的配置数据加载输入训练模型;S5、进行模型训练:S51、通过预训练来初始化神经网络的权重,S52、通过分类器进行处理,S53、通过余弦相似性的三元组损失函数进行评估,S54、通过归一化处理使评估数据标准化;S6、生成声纹识别的声纹库并保存。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都傅立叶电子科技有限公司,未经成都傅立叶电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811336977.5/,转载请声明来源钻瓜专利网。