[发明专利]建立声纹模型的方法和装置有效
申请号: | 201611005290.4 | 申请日: | 2016-11-11 |
公开(公告)号: | CN106782567B | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 卢道和;陈朝亮;杨军;黄叶飞;杨粟;李晓俊;钟伟 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 建立 声纹 模型 方法 装置 | ||
1.一种建立声纹模型的方法,其特征在于,所述建立声纹模型的方法包括:
当获取到人脸视频,且成功识别所述人脸视频的人脸图像时,提取所述人脸视频中的音频文件,记为第一音频文件;
输出提示信息,以提示审核人员审核所述人脸视频;
当接收到所述人脸视频审核通过的通知消息时,判断是否已存在声纹模型;
若未存在声纹模型,则根据所述第一音频文件建立声纹模型;
若已存在声纹模型,则删除已存在的声纹模型,提取所存储的第二音频文件,其中,所述第二音频文件为注册成功的音频文件,注册成功的音频文件是已建立过声纹模型的音频文件;
将所述第一音频文件和所述第二音频文件进行叠加,得到声纹模型。
2.如权利要求1所述的建立声纹模型的方法,其特征在于,所述提取所存储的第二音频文件的步骤包括:
判断是否存储有预设数目的所述第二音频文件;
若存储有所述预设数目的所述第二音频文件,则所述根据所述第一音频文件和所述第二音频文件建立声纹模型的步骤包括:
根据最近所存储预设数目的所述第二音频文件和所述第一音频文件建立声纹模型。
3.如权利要求2所述的建立声纹模型的方法,其特征在于,所述判断是否存储有预设数目的所述第二音频文件的步骤之后,还包括:
若未存储有所述预设数目的所述第二音频文件,则获取所存储的所有所述第二音频文件;
所述根据所述第一音频文件和所述第二音频文件建立声纹模型的步骤包括:
根据所获取的所有所述第二音频文件和所述第一音频文件建立声纹模型。
4.如权利要求1至3任一项所述的建立声纹模型的方法,其特征在于,所述当获取到人脸视频,且成功识别所述人脸视频的人脸图像时,提取所述人脸视频中的音频文件,记为第一音频文件的步骤之后,还包括:
判断是否已存在声纹模型;
若未存在声纹模型,则执行输出提示信息,以提示审核人员审核所述人脸视频的步骤;
若已存在声纹模型,则提取与所述声纹模型对应的音频文件,记为第三音频文件;
将所述第一音频文件与所述第三音频文件进行对比,得到所述第一音频文件与所述第三音频文件之间的相似度;
将所述第一音频文件与所述第三音频文件之间的相似度发送给异步审核系统,并执行输出提示信息,以提示审核人员审核所述人脸视频的步骤。
5.一种建立声纹模型的装置,其特征在于,所述建立声纹模型的装置包括:
提取模块,用于当获取到人脸视频,且成功识别所述人脸视频的人脸图像时,提取所述人脸视频中的音频文件,记为第一音频文件;
输出模块,用于输出提示信息,以提示审核人员审核所述人脸视频;
建立模块,用于当接收到所述人脸视频审核通过的通知消息时,根据所述第一音频文件建立声纹模型;
所述建立模块包括:
判断单元,用于当接收到所述人脸视频审核通过的通知消息时,判断是否已存在声纹模型;
建立单元,用于若未存在声纹模型,则根据所述第一音频文件建立声纹模型;
提取单元,用于若已存在声纹模型,则删除已存在的声纹模型,提取所存储的第二音频文件,其中,所述第二音频文件为注册成功的音频文件,注册成功的音频文件是已建立过声纹模型的音频文件;
所述建立单元还用于将所述第一音频文件和所述第二音频文件进行叠加,得到声纹模型。
6.如权利要求5所述的建立声纹模型的装置,其特征在于,所述判断单元还用于判断是否存储有预设数目的所述第二音频文件;
所述建立单元还用于若存储有所述预设数目的所述第二音频文件,则根据最近所存储预设数目的所述第二音频文件和所述第一音频文件建立声纹模型。
7.如权利要求6所述的建立声纹模型的装置,其特征在于,所述建立模块还包括:
获取单元,用于若未存储有所述预设数目的所述第二音频文件,则获取所存储的所有所述第二音频文件;
所述建立单元还用于根据所获取的所有所述第二音频文件和所述第一音频文件建立声纹模型。
8.如权利要求5至7任一项所述的建立声纹模型的装置,其特征在于,所述建立声纹模型的装置还包括:
判断模块,用于判断是否已存在声纹模型;
所述输出模块还用于若未存在声纹模型,则输出提示信息,以提示审核人员审核所述人脸视频;
所述提取模块还用于若已存在声纹模型,则提取与所述声纹模型对应的音频文件,记为第三音频文件;
所述建立声纹模型的装置还包括:
对比模块,用于将所述第一音频文件与所述第三音频文件进行对比,得到所述第一音频文件与所述第三音频文件之间的相似度;
发送模块,用于将所述第一音频文件与所述第三音频文件之间的相似度发送给异步审核系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611005290.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:收集个人声音特征的方法
- 下一篇:一种频率极值和均值结合的声纹过滤方法