[发明专利]语音验证方法、装置、计算机设备和计算机可读存储介质有效
申请号: | 201810041764.3 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108305633B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 黄创茗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/08;G10L13/02;G10L15/26;G10L21/02;G10L21/0208;G10L25/12;G10L25/18;G10L25/24 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
地址: | 518052 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹特征 特征模型 验证 语音验证 场景类型 用户标识 计算机设备 语音信息 匹配 计算机可读存储介质 存储介质 身份验证 文本转换 验证通过 用户声音 参考 文本 查询 更新 申请 | ||
1.一种语音验证方法,所述方法包括:
获取待验证语音信息和相应的用户标识;
从所述待验证语音信息中提取待验证的声纹特征和待验证文本;所述待验证文本是由所述声纹特征转化的;
获取当前场景类型;
查询与所述当前场景类型匹配、且与所述用户标识对应的特征模型;
通过所述特征模型,将所述待验证文本转换为参考声纹特征;
比较所述待验证的声纹特征和所述参考声纹特征,得到语音验证结果;
当所述语音验证结果表示验证通过时,则根据所述待验证的声纹特征对所述特征模型进行再训练;
使用再训练后的特征模型更新与所述当前场景类型匹配、且与所述用户标识对应的特征模型;
所述通过所述特征模型,将所述待验证文本转换为参考声纹特征包括:
将待验证文本通过所述特征模型转换成语音信息,并从转换得到的语音信息中提取参考声纹特征;
所述获取当前场景类型包括:
获取采集所述待验证语音信息的时间信息和地理位置信息;
查找与所述时间信息和所述地理位置信息相匹配的天气信息;
查询与所述天气信息相匹配的预设场景类型;
将查询到的预设场景类型作为当前场景类型。
2.根据权利要求1所述的方法,其特征在于,所述获取待验证语音信息和相应的用户标识,包括:
获取身份验证指令;
响应于所述身份验证指令,获取用户标识;
查询对应于所述用户标识预配置的文本;
当未查询到所述文本时,随机生成文本;
反馈随机生成的所述文本;
采集与反馈的所述文本相匹配的待验证语音信息。
3.根据权利要求1所述的方法,其特征在于,所述从所述待验证语音信息中提取待验证的声纹特征和待验证文本,包括:
解析所述待验证语音信息,得到相应的声波信号;
将所述声波信号分帧,得到每一帧的声波信号;
对所述每一帧的声波信号进行傅立叶变换,得到相应的频谱;
从所述频谱中提取单帧声纹特征;
根据每一帧的单帧声纹特征生成所述待验证语音信息的声纹特征;
将所述声纹特征转化为待验证文本。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
采集当前的噪音信息;
根据采集的噪音信息生成抗干扰模型;
在解析得到声波信号后,通过所述抗干扰模型将解析得到的声波信号修正后,执行所述将所述声波信号分帧,得到每一帧的声波信号的步骤。
5.根据权利要求1所述的方法,其特征在于,所述获取当前场景类型包括:
获取采集所述待验证语音信息的时间信息和/或地理位置信息;
查询与所述时间信息和/或地理位置信息相匹配的预设场景类型;
将查询到的预设场景类型作为当前场景类型。
6.根据权利要求1至5中任一项所述的方法,其特征在于,还包括:
获取公共特征模型;
获取与预设场景类型和所述用户标识相对应的训练语音样本;
根据所述训练语音样本将所述公共特征模型进行再训练,得到与所述预设场景类型和所述用户标识相匹配的特征模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810041764.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种会议的语音摘要形成方法及系统
- 下一篇:解码方法、解码器及存储介质