[发明专利]声纹模型的训练方法、装置、存储介质及电子设备有效

申请号：	201910537129.9	申请日：	2019-06-20
公开（公告）号：	CN110265040B	公开（公告）日：	2022-05-17
发明（设计）人：	陈岩	申请（专利权）人：	OPPO广东移动通信有限公司
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/00;G10L15/26;G10L25/48
代理公司：	北京恒博知识产权代理有限公司 11528	代理人：	范胜祥
地址：	523860 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声纹模型训练方法装置存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种声纹模型的训练方法、装置、存储介质及电子设备，属于计算机技术领域。所述方法包括：对用户的语音数据进行年龄估测得到年龄估测结果，根据年龄估测结果对应的声纹通用模型对模型训练得到该用户的声纹个人模型，实现对不同年龄段的用户使用不同的声纹个人模型进行声纹唤醒。本申请得到的声纹个人模型和用户的年龄有关，根据声纹个人模型进行声纹唤醒能提高唤醒的准确率。

技术领域

本申请涉及语音处理领域，尤其涉及一种声纹模型的训练方法、装置、存储介质及电子设备。

背景技术

声纹识别是根据声音具有用户的生物特征，识别用户的身份的一种识别技术。与传统的身份识别技术相比，声纹识别的优势在于提取过程简单且成本低，广泛应用在各种需要进行安全保护的场合，例如：银行、证券、保险等金融机构。由于语音是一种很随机的过程，各种内在因素或外在因素对发音影响很大，这样用户发出的语音数据的声学特征会发生变化，现有的唤醒方法无法适应变化从而造成唤醒的准确率不高的问题。

发明内容

本申请实施例提供了的声纹模型的训练方法、装置、存储介质及终端，可以解决不同年龄层的用户对设备进行声纹唤醒的准确率不高的问题。所述技术方案如下：

第一方面，本申请实施例提供了一种声纹模型的训练方法，所述方法包括：

获取用户的语音数据；

对所述语音数据进行年龄估测得到年龄估测结果；

在多个声纹通用模型中查询所述年龄估测结果对应的目标声纹通用模型；其中，所述多个声纹通用模型各自对应不同的年龄段，所述声纹通用模型用户唤醒词识别；

训练单元，用于根据语音数据对所述目标声纹通用模型进行训练得到所述用户的声纹个人模型；其中，所述声纹个人模型用于识别待识别语音数据的用户身份是否为所述用户。

第二方面，本申请实施例提供了一种声纹唤醒装置，所述装置包括：

获取单元，用于获取用户的语音数据；

评估单元，用于对所述语音数据进行年龄估测得到年龄估测结果；

查询单元，用于在多个声纹通用模型中查询所述年龄估测结果对应的目标声纹通用模型；其中，多个声纹通用模型各自对应不同的年龄段，所述声纹通用模型用于唤醒词识别；

训练单元，用于根据所述语音数据对所述目标声纹通用模型进行训练得到所述用户的声纹个人模型；其中，所述声纹个人模型用于识别待识别语音数据的用户身份是否为所述用户。

第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。

第四方面，本申请实施例提供一种电子设备，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

本申请一些实施例提供的技术方案带来的有益效果至少包括：

对用户的语音数据进行年龄估测得到年龄估测结果，根据年龄估测结果对应的声纹通用模型进行训练得到该用户的声纹个人模型，实现对不同年龄段的用户使用不同的声纹个人模型进行声纹唤醒，解决现有的声纹个人模型识别非指定年龄段的声纹造成的唤醒准确率不高的问题，本申请能自适应的根据不同年龄的用户选择合适的声纹个人模型进行声纹唤醒，提高声纹唤醒的准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司，未经OPPO广东移动通信有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910537129.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于字典学习和低秩矩阵分解的说话人识别方法
下一篇：一种收集、分析猪的发声行为的方法和系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声纹模型的训练方法、装置、存储介质及电子设备有效

专利文献下载