[发明专利]一种语音校验方法和装置有效

专利信息
申请号: 201910838255.8 申请日: 2019-09-05
公开(公告)号: CN110675881B 公开(公告)日: 2021-02-19
发明(设计)人: 王愈;李健;张连毅;武卫东 申请(专利权)人: 北京捷通华声科技股份有限公司
主分类号: G10L17/12 分类号: G10L17/12;G10L17/02;G10L17/04;G10L17/26;G10L25/24
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100193 北京市海淀区东北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种语音校验方法和装置,所述方法包括:获取待校验的语音数据;对所述语音数据进行处理,获得所述语音数据的谱参数;根据所述谱参数及预先训练的目标声纹校验模型,确定所述谱参数对应的分值,其中,所述预先训练的目标声纹校验模型通过语音合成模型和声纹校验模型联合训练获得;在所述分值大于预设值的情况下,确定所述待校验的语音数据来自用户的真实语音。通过语音合成模型和声纹校验模型的联合训练得到目标声纹校验模型,对获取的语音数据进行校验,提高了对语音校验的准确性。
搜索关键词: 一种 语音 校验 方法 装置
【主权项】:
1.一种语音校验方法,其特征在于,所述方法包括:/n获取待校验的语音数据;/n对所述语音数据进行处理,获得所述语音数据的谱参数;/n根据所述谱参数及预先训练的目标声纹校验模型,确定所述谱参数对应的分值,其中,所述预先训练的目标声纹校验模型通过语音合成模型和声纹校验模型联合训练获得;/n在所述分值大于预设值的情况下,确定所述待校验的语音数据来自用户的真实语音。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910838255.8/,转载请声明来源钻瓜专利网。

同类专利
  • 一种身份识别方法及智能设备-202111142055.2
  • 刘建国;栾天祥;赵培;王迪 - 青岛海尔科技有限公司;海尔智家股份有限公司
  • 2021-09-28 - 2022-01-04 - G10L17/12
  • 本发明提供了一种身份识别方法及智能设备,该方法为:从待识别用户的语音数据中提取待处理语音特征;利用预先训练得到的分类器模型对待处理语音特征进行处理,得到待处理语音特征对应各个身份类别的类别评分,分类器模型由基于预先采集的语音样本数据训练得到;确定类别评分最高的身份类别对应的预设真实身份为待识别用户的最终身份识别结果。本方案中,在智能设备的使用过程中采集语音样本数据并据此训练得到分类器模型。利用分类器模型对待识别用户新进的语音数据进行处理,并根据处理结果确定最终身份识别结果。用户不需要注册声纹数据即可进行身份识别,节省了用户的声纹数据注册操作,提高用户使用体验。
  • 更新声纹数据的语音识别方法、终端装置及存储介质-201810030623.1
  • 王健宗;郑斯奇;于夕畔;肖京 - 平安科技(深圳)有限公司
  • 2018-01-12 - 2021-11-02 - G10L17/12
  • 本发明公开了一种更新声纹数据的语音识别方法,包括:注册预设数目的注册语音,并计算每条注册语音的特征语音向量;将所述每条注册语音的特征语音向量进行两两比对打分;获取验证语音,并计算所述验证语音的特征语音向量;将所述验证语音的特征语音向量分别和注册语音的特征语音向量进行两两比对打分,并根据所述验证语音更新所述预设数目的注册语音。本发明还提供一种终端装置及存储介质。本发明提供的更新声纹数据的语音识别方法、终端装置及存储介质,可以在用户每次验证时,都将按照对比和更新的流程进行,可以提升后续声纹验证准确率,且能适应注册人随时间波动的声音变化。
  • 一种基于深度学习的人工合成声纹检测系统及方法-201910527094.0
  • 翁健;林越;郑晓鹏;罗晓峰;陈俊颖;温钊迪;罗伟其 - 暨南大学
  • 2019-06-18 - 2021-09-07 - G10L17/12
  • 本发明公开了一种基于深度学习的人工合成声纹检测系统及方法,该系统包括:包括自编码器、生成器和辨别器,自编码器包括编码器和解码器,编码器包括编码器第一卷积层、编码器批归一化层、编码器第一最大池化层、编码器第二卷积层、编码器第二最大池化层和编码器全连接层;解码器包括解码器嵌入层、解码器全连接层、解码器批归一化层、解码器第一反卷积层序列、解码器第二反卷积层序列和解码器卷积层序列;生成器结构与解密器结构相同;辨别器包括辨别器嵌入层、辨别器全连接层、辨别器第一卷积层序列、辨别器第二卷积层序列、多分类器和辨别器输出层。本发明对人工合成声纹达到较高的检测准确率,同时对属于已知类的样本有更好的分类效果。
  • 一种语音分离方法、装置、电子设备和存储介质-202110616937.1
  • 王鸣;梁家恩 - 云知声(上海)智能科技有限公司
  • 2021-06-02 - 2021-08-31 - G10L17/12
  • 本发明涉及一种语音分离方法、装置、电子设备和存储介质,该方法包括:获取待分离语音,将待分离语音切成多个短语音片;使用第一目标说话人的声纹模型对多个短语音片进行相似度打分得到多个第一结果;使用第二目标说话人的声纹模型对多个短语音片进行相似度打分得到多个第二结果;比较每个短语音片的第一结果和第二结果;若第一结果大于第二结果,则短语音片是第一目标说话人的语音;若第一结果小于第二结果,则短语音片是第二目标说话人的语音。本申请实施例中通过不同的声纹模型对多个短语音片进行相似度打分,得到不同的相似度打分结果,比较每个短语音片的多个相似度打分结果,确定短语音片是哪个说话人的声音,对语音进行分离。
  • 基于家庭用户级的声纹身份认证系统和智能检测马桶-202110404410.2
  • 李春林 - 重庆德方信息技术有限公司
  • 2021-04-15 - 2021-07-13 - G10L17/12
  • 本发明公开了一种基于家庭用户级的声纹身份认证系统,包括声音采集器、声音检测单元、声音预处理单元、声纹特征提取单元、UBM模型训练单元、声纹库和判决单元;本发明还公开了一种智能检测马桶。本发明中,通过声纹识别进行家庭用户的身份认证,身份认证过程更加简单,且不存在隐私泄露问题,大大改善了用户的使用体验;设置声音检测单元,当音频信号的最大幅值超过预设的启动幅值时才使声纹认证系统启动工作,能够减小系统的待机功耗;采用UBM模型训练家庭成员的声纹模型,训练时间短,训练效率高。
  • 基于总变化空间与分类器联合优化的说话人身份识别方法-201910439064.4
  • 韩纪庆;陈晨;郑贵滨;郑铁然 - 哈尔滨工业大学
  • 2019-05-24 - 2021-03-23 - G10L17/12
  • 基于总变化空间与分类器联合优化的说话人身份识别方法,它属于说话人识别技术领域。本发明解决了目前的总变化空间估计方法对说话人身份识别的等错误率高的问题。本发明首先求得训练集均值超矢量在初始总变化空间上的表示;然后对该表示进行长度规整,并输入分类器PLDA;接着在分类器PLDA的监督下,更新分类器的参数与总变化空间的参数,重复上述步骤,直至达到设置的最大迭代次数,获得最终的分类器参数与总变化空间参数;测试时,利用测试语音的均值超矢量和目标说话人的均值超矢量,计算其在总变化空间上的表示,然后对该表示进行长度规整,并计算其在分类器上的联合概率密度作为最终分类的依据。本发明可以应用于说话人识别技术领域。
  • 一种语音校验方法和装置-201910838255.8
  • 王愈;李健;张连毅;武卫东 - 北京捷通华声科技股份有限公司
  • 2019-09-05 - 2021-02-19 - G10L17/12
  • 本发明提供了一种语音校验方法和装置,所述方法包括:获取待校验的语音数据;对所述语音数据进行处理,获得所述语音数据的谱参数;根据所述谱参数及预先训练的目标声纹校验模型,确定所述谱参数对应的分值,其中,所述预先训练的目标声纹校验模型通过语音合成模型和声纹校验模型联合训练获得;在所述分值大于预设值的情况下,确定所述待校验的语音数据来自用户的真实语音。通过语音合成模型和声纹校验模型的联合训练得到目标声纹校验模型,对获取的语音数据进行校验,提高了对语音校验的准确性。
  • 由计算机实施的语音命令验证方法及电子装置-202010161382.1
  • 伊夫林柯尼亚瓦堤;沙席拉吉索马拉金 - 美律电子(深圳)有限公司
  • 2020-03-10 - 2020-07-28 - G10L17/12
  • 本发明提供一种由计算机实施的语音命令验证方法。该方法包括:获得声音讯号流;计算声音讯号流的讯号噪声比(SNR)值;将声音讯号流转换成梅尔频率倒频谱系数(MFCC)流;根据梅尔频率倒频谱系数流及根据由高斯混合模型‑通用背景模型(GMM‑UBM)产生的多个样本流中的一者计算与梅尔频率倒频谱系数流对应的动态时间扭曲(DTW)距离;根据梅尔频率倒频谱系数流及样本流计算与梅尔频率倒频谱系数流对应的对数似然比(LLR)值作为高斯混合模型‑通用背景模型得分;根据高斯混合模型‑通用背景模型得分、动态时间扭曲距离及讯号噪声比值判断声音讯号流是否通过语音命令验证;响应于判定声音讯号流通过语音命令验证,判定声音讯号流是自合法使用者发出的语音流。
  • 一种说话人识别方法及系统-201210555152.9
  • 周若华;颜永红;梁春燕;杨琳 - 中国科学院声学研究所;北京中科信利技术有限公司
  • 2012-12-19 - 2013-05-01 - G10L17/12
  • 本发明涉及一种说话人识别方法,所述方法包括:通过训练得到邻域保持嵌入空间矩阵;基于所述邻域保持嵌入空间矩阵进行说话人识别;所述基于所述邻域保持嵌入空间矩阵进行说话人识别,包括:对于每一个高斯混合模型GMM均值超向量x进行主成分分析PCA降维得到向量w;使用所述邻域保持嵌入空间矩阵对于每一个所述向量w进行映射得到向量w’;将经过映射得到的所述向量w’作为支持向量机SVM的输入特征进行后端分类建模;借助支持向量机SVM打分,根据打分结果识别说话人。本发明实施例采用一种新型的基于邻域保持嵌入NPE的因子分析技术,能够有效地克服现有总变化因子分析技术存在的不足,进一步提高说话人识别性能。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top