[发明专利]深度神经网络模型、电子装置、身份验证方法和存储介质有效
| 申请号: | 201810225142.6 | 申请日: | 2018-03-19 |
| 公开(公告)号: | CN108564954B | 公开(公告)日: | 2020-01-10 |
| 发明(设计)人: | 赵峰;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L25/24;G10L25/30;G06N3/04 |
| 代理公司: | 44347 深圳市沃德知识产权代理事务所(普通合伙) | 代理人: | 高杰;于志光 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 身份验证 预设 标准语音数据 神经网络模型 语音帧 余弦相似度 存储介质 电子装置 声学特征 特征矢量 语音数据 滤波器 身份验证结果 标准语音 大小确定 目标用户 预设结构 分帧 帧组 验证 身份 | ||
本发明公开一种深度神经网络模型、电子装置、身份验证方法和存储介质,该方法包括:在收到待进行身份验证的目标用户的当前语音数据后,获取待验证的身份对应的标准语音数据,将这两个标准语音数据分别分帧处理,以得到当前语音帧组和标准语音帧组;利用预设滤波器分别提取出两个语音帧组中的各个语音帧的预设类型声学特征;将提取出的预设类型声学特征输入预先训练好的预设结构深度神经网络模型,以得到当前语音数据和标准语音数据各自对应的预设长度的特征矢量;计算得到的两个特征矢量的余弦相似度,并根据计算出的余弦相似度大小确定身份验证结果。本发明技术方案提升了说话人身份验证的准确性。
技术领域
本发明涉及声纹识别技术领域,特别涉及一种深度神经网络模型、电子装置、身份验证方法和存储介质。
背景技术
说话人识别通常称为声纹识别,是生物识别技术的一种,常被用来确认某段语音是否是指定的某个人所说,是“一对一判别”问题。说话人识别广泛应用于诸多领域,例如,在金融、证券、社保、公安、军队及其他民用安全认证等领域都有着广泛的应用需求。
说话人识别包括文本相关识别和文本无关识别两种方式,近年来文本无关说话人识别技术不断突破,其准确性较之以往有了极大的提升。然而在某些受限情况下,比如采集到的说话人有效语音较短(时长小于5秒的语音)的情况下,现有的文本无关说话人识别技术的准确性不高,很容易出错。
发明内容
本发明的主要目的是提供一种深度神经网络模型、电子装置、身份验证方法和存储介质,旨在旨在提升说话人身份验证的准确性。
为实现上述目的,本发明提出的深度神经网络模型,包括:
第一层结构:是由多层堆叠的有相同预设结构的神经网络层,每个预设结构的神经网络层包括:两个串联的CNN卷积层,两个修正线性单元ReLU,及一个将两个串联的CNN卷积层跨层直连的直连操作X,其中,各个ReLU与各个CNN卷积层一一对应,且各个ReLU分别串联在对应的CNN卷积层后,所述直连操作X将两个串联的CNN卷积层的第一个CNN卷积层的卷积操作的输入与第二个CNN卷积层的卷积操作的输出相加,并将结果送入到第二个CNN卷积层对应的ReLU操作中;
第二层结构:是平均层,此层的作用是沿时间轴向对矢量序列求平均值,它将第一层结构输出的二维矢量序列进行平均化;
第三层结构:是DNN全连接层;
第四层结构:是归一化层,此层将上一层的输入按照L2范数进行归一化,得到长度为1的归一化后的特征矢量;
第五层结构:是损失层,损失函数L的公式为:其中α是取值范围在0.05~0.2之间的常量,代表属于同一说话人的两个特征矢量的余弦相似度,代表不属于同一说话人的两个特征矢量的余弦相似度。
优选地,所述深度神经网络模型的训练过程为:
S1、获取预设数量语音数据样本,对各个语音数据样本分别标注代表对应的说话人身份的标签;
S2、分别对每个语音数据样本进行活动端点检测,将语音数据样本中非说话人的语音删除,得到预设数量的标准语音数据样本;
S3、将得到的标准语音数据样本的第一百分比作为训练集,第二百分比作为验证集,所述第一百分比与第二百分比的和小于等于100%;
S4、将所述训练集和验证集中的各个标准语音数据样本按照预设的分帧参数分别进行分帧处理,以获得每个标准语音数据样本对应的语音帧组,再利用预设滤波器分别提取出每个语音帧组中的各个语音帧的预设类型声学特征;
S5、将所述训练集中的各个语音帧组对应的预设类型声学特征划分成M批,分批输入所述深度神经网络模型中进行迭代训练,并在所述深度神经网络模型训练完成后,采用验证集对所述深度神经网络模型的准确率进行验证;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810225142.6/2.html,转载请声明来源钻瓜专利网。





