[发明专利]基于声纹识别的身份辨别方法在审

专利信息
申请号: 201910916553.4 申请日: 2019-09-26
公开(公告)号: CN110610709A 公开(公告)日: 2019-12-24
发明(设计)人: 王磊 申请(专利权)人: 浙江百应科技有限公司
主分类号: G10L17/04 分类号: G10L17/04;G10L17/18;G10L17/00
代理公司: 11350 北京科亿知识产权代理事务所(普通合伙) 代理人: 汤东凤
地址: 311121 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及语音识别领域,尤其涉及基于声纹识别的身份辨别方法,包括:基于语料库通过深度学习算法训练声纹模型;将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;根据计算得到的相似度,判断外呼语音是否为同一用户所发出。本发明实现外呼过程中,判别机主是否有换人接听。
搜索关键词: 语音 声纹模型 声纹特征 向量 样本 声纹数据库 分片处理 特征向量 测试声 相似度计算 余弦相似度 身份辨别 声纹识别 同一用户 学习算法 样本语音 用户接听 语音识别 相似度 语料库 机主 接听 算法 采集
【主权项】:
1.基于声纹识别的身份辨别方法,其特征在于,包括:/n基于语料库通过深度学习算法训练声纹模型;/n将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;/n采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;/n将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;/n基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;/n根据计算得到的相似度,判断外呼语音是否为同一用户所发出。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百应科技有限公司,未经浙江百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910916553.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种对录音鉴定来源设备的方法-201910139288.3
  • 罗达;张剑;袁华强 - 东莞理工学院
  • 2019-02-22 - 2020-02-07 - G10L17/04
  • 本发明公开了一种对录音鉴定来源设备的方法,包括以下步骤:S1:将待鉴定的设备分为两类,一类定义为目标设备,另一类是非目标设备;S2:将上述的两类设备分别进行声音的采集,然后进行预处理,使其满足堆叠自编码器的要求;S3:两类设备的音频样本通过预处理之后得到的输出结果,用于训练堆叠自编码器,得到堆叠自编码器的相关参数;S4:目标设备的音频样本的预处理的输出结果用作堆叠自编码器的输入,将堆叠自编码器的内源性优化特征用于训练LPDD单分类模块;所述的堆叠自编码网络的输出定义为内源性优化特征;S5:通过训练后的堆叠自编码器及训练后的LPDD单分类模块,对待鉴定设备的录音样本进行判别。
  • 一种移动平台的控制方法及控制设备-201880037663.7
  • 林浩;杨小虎 - 深圳市大疆创新科技有限公司
  • 2018-10-31 - 2020-01-21 - G10L17/04
  • 一种移动平台的控制方法及控制设备,其中方法应用于控制设备,方法包括:对用户输入的语音进行处理,得到语音控制信号(S201);对语音控制信号进行声纹识别,验证用户的身份(S202);若用户的身份验证通过,则对语音控制信号进行语音识别处理,得到控制指令(S203);向移动平台发送控制指令,以对移动平台进行控制(S204)。通过本实施例可以实现对移动平台的语音控制,提高移动平台控制的便捷性。
  • 说话者模型制作系统-201910110478.2
  • 藤村浩司 - 株式会社东芝
  • 2019-02-12 - 2020-01-17 - G10L17/04
  • 本发明提供一种说话者模型制作系统,能够以更少的数据更高效地执行说话者登记。说话者模型制作系统具备扩展部和制作部。扩展部根据多个图案来变更从输入层至规定的中间层为止的网络参数的一部分,针对与多个图案对应的变更后的神经网络分别输入1个声音,从而从中间层得到多个输出。制作部根据多个输出,制作针对从声音检测出的单词的说话者模型。
  • 声纹模型重建方法、终端、装置及可读存储介质-201910775992.8
  • 陈昊亮;罗伟航;李炳霖 - 广州国音智能科技有限公司
  • 2019-08-21 - 2020-01-03 - G10L17/04
  • 本发明公开了一种声纹模型重建方法,包括以下步骤:获取语音样本数据,基于所述语音样本数据生成初始声纹模型,其中,所述语音样本数据包括多个子语音样本数据,而后基于所述初始声纹模型获取各个子语音样本数据的声纹特征向量,并基于K‑Means算法以及各个声纹特征向量对所述语音样本数据进行聚类,将所述语音样本数据分成预设数量的子样本集,接下来基于所述预设数量的子样本集生成目标声纹模型。本发明还公开了一种装置、终端及可读存储介质。本发明通过对语音样本数据进行聚类分组,进而以迭代的方式利用分组后的语音子样本集训练声纹模型,提升了声纹模型训练效率,以及声纹模型的健壮性。
  • 基于声纹识别的身份辨别方法-201910916553.4
  • 王磊 - 浙江百应科技有限公司
  • 2019-09-26 - 2019-12-24 - G10L17/04
  • 本发明涉及语音识别领域,尤其涉及基于声纹识别的身份辨别方法,包括:基于语料库通过深度学习算法训练声纹模型;将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;根据计算得到的相似度,判断外呼语音是否为同一用户所发出。本发明实现外呼过程中,判别机主是否有换人接听。
  • 一种定期更新缓存中训练语句的声纹识别的方法及系统-201610025369.7
  • 祝铭明 - 芋头科技(杭州)有限公司
  • 2016-01-14 - 2019-12-03 - G10L17/04
  • 本发明属于语音信号处理领域,尤其涉及一种定期更新缓存中训练语句的声纹识别方法及系统,应用于家用机器人,包括:S1:采集语音信号;S2:对语音信号进行预处理;S3:自预处理后的语音信号中提取语音特征参数;S4:为每一个家庭成员建立声学模型;S5:预先根据使用频率将声学模型区分为常用的第一声学模型和不常用的第二声学模型,并在通电时将第一声学模型加载至缓存中;S6:对第一声学模型中的训练语句进行检测,若第一声学模型具有在该设定的时间段内一次未使用到的训练语句,则从第二声学模型中随机挑选相应数量的训练语句补充到第一声学模型中;S7:依据第一声学模型和第二声学模型对待测语音信号进行模式匹配,获取识别结果。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top