[发明专利]一种语音校验方法和装置有效

申请号：	201910838255.8	申请日：	2019-09-05
公开（公告）号：	CN110675881B	公开（公告）日：	2021-02-19
发明（设计）人：	王愈;李健;张连毅;武卫东	申请（专利权）人：	北京捷通华声科技股份有限公司
主分类号：	G10L17/12	分类号：	G10L17/12;G10L17/02;G10L17/04;G10L17/26;G10L25/24
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	莎日娜
地址：	100193 北京市海淀区东北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种语音校验方法和装置，所述方法包括：获取待校验的语音数据；对所述语音数据进行处理，获得所述语音数据的谱参数；根据所述谱参数及预先训练的目标声纹校验模型，确定所述谱参数对应的分值，其中，所述预先训练的目标声纹校验模型通过语音合成模型和声纹校验模型联合训练获得；在所述分值大于预设值的情况下，确定所述待校验的语音数据来自用户的真实语音。通过语音合成模型和声纹校验模型的联合训练得到目标声纹校验模型，对获取的语音数据进行校验，提高了对语音校验的准确性。
搜索关键词：	一种语音校验方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音校验方法，其特征在于，所述方法包括：/n获取待校验的语音数据；/n对所述语音数据进行处理，获得所述语音数据的谱参数；/n根据所述谱参数及预先训练的目标声纹校验模型，确定所述谱参数对应的分值，其中，所述预先训练的目标声纹校验模型通过语音合成模型和声纹校验模型联合训练获得；/n在所述分值大于预设值的情况下，确定所述待校验的语音数据来自用户的真实语音。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司，未经北京捷通华声科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910838255.8/，转载请声明来源钻瓜专利网。

上一篇：身份验证方法、装置和电子设备
下一篇：用于对降混合矩阵解码及编码的方法、编码器及解码器

同类专利

一种身份识别方法及智能设备-202111142055.2
发明人：刘建国;栾天祥;赵培;王迪 -专利权人：青岛海尔科技有限公司;海尔智家股份有限公司
申请日： 2021-09-28 - 公布日： 2022-01-04 - 主分类号： G10L17/12
摘要：本发明提供了一种身份识别方法及智能设备，该方法为：从待识别用户的语音数据中提取待处理语音特征；利用预先训练得到的分类器模型对待处理语音特征进行处理，得到待处理语音特征对应各个身份类别的类别评分，分类器模型由基于预先采集的语音样本数据训练得到；确定类别评分最高的身份类别对应的预设真实身份为待识别用户的最终身份识别结果。本方案中，在智能设备的使用过程中采集语音样本数据并据此训练得到分类器模型。利用分类器模型对待识别用户新进的语音数据进行处理，并根据处理结果确定最终身份识别结果。用户不需要注册声纹数据即可进行身份识别，节省了用户的声纹数据注册操作，提高用户使用体验。

更新声纹数据的语音识别方法、终端装置及存储介质-201810030623.1
发明人：王健宗;郑斯奇;于夕畔;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2018-01-12 - 公布日： 2021-11-02 - 主分类号： G10L17/12
摘要：本发明公开了一种更新声纹数据的语音识别方法，包括：注册预设数目的注册语音，并计算每条注册语音的特征语音向量；将所述每条注册语音的特征语音向量进行两两比对打分；获取验证语音，并计算所述验证语音的特征语音向量；将所述验证语音的特征语音向量分别和注册语音的特征语音向量进行两两比对打分，并根据所述验证语音更新所述预设数目的注册语音。本发明还提供一种终端装置及存储介质。本发明提供的更新声纹数据的语音识别方法、终端装置及存储介质，可以在用户每次验证时，都将按照对比和更新的流程进行，可以提升后续声纹验证准确率，且能适应注册人随时间波动的声音变化。

一种基于深度学习的人工合成声纹检测系统及方法-201910527094.0
发明人：翁健;林越;郑晓鹏;罗晓峰;陈俊颖;温钊迪;罗伟其 -专利权人：暨南大学
申请日： 2019-06-18 - 公布日： 2021-09-07 - 主分类号： G10L17/12
摘要：本发明公开了一种基于深度学习的人工合成声纹检测系统及方法，该系统包括：包括自编码器、生成器和辨别器，自编码器包括编码器和解码器，编码器包括编码器第一卷积层、编码器批归一化层、编码器第一最大池化层、编码器第二卷积层、编码器第二最大池化层和编码器全连接层；解码器包括解码器嵌入层、解码器全连接层、解码器批归一化层、解码器第一反卷积层序列、解码器第二反卷积层序列和解码器卷积层序列；生成器结构与解密器结构相同；辨别器包括辨别器嵌入层、辨别器全连接层、辨别器第一卷积层序列、辨别器第二卷积层序列、多分类器和辨别器输出层。本发明对人工合成声纹达到较高的检测准确率，同时对属于已知类的样本有更好的分类效果。

一种语音分离方法、装置、电子设备和存储介质-202110616937.1
发明人：王鸣;梁家恩 -专利权人：云知声（上海）智能科技有限公司
申请日： 2021-06-02 - 公布日： 2021-08-31 - 主分类号： G10L17/12
摘要：本发明涉及一种语音分离方法、装置、电子设备和存储介质，该方法包括：获取待分离语音，将待分离语音切成多个短语音片；使用第一目标说话人的声纹模型对多个短语音片进行相似度打分得到多个第一结果；使用第二目标说话人的声纹模型对多个短语音片进行相似度打分得到多个第二结果；比较每个短语音片的第一结果和第二结果；若第一结果大于第二结果，则短语音片是第一目标说话人的语音；若第一结果小于第二结果，则短语音片是第二目标说话人的语音。本申请实施例中通过不同的声纹模型对多个短语音片进行相似度打分，得到不同的相似度打分结果，比较每个短语音片的多个相似度打分结果，确定短语音片是哪个说话人的声音，对语音进行分离。

基于家庭用户级的声纹身份认证系统和智能检测马桶-202110404410.2
发明人：李春林 -专利权人：重庆德方信息技术有限公司
申请日： 2021-04-15 - 公布日： 2021-07-13 - 主分类号： G10L17/12
摘要：本发明公开了一种基于家庭用户级的声纹身份认证系统，包括声音采集器、声音检测单元、声音预处理单元、声纹特征提取单元、UBM模型训练单元、声纹库和判决单元；本发明还公开了一种智能检测马桶。本发明中，通过声纹识别进行家庭用户的身份认证，身份认证过程更加简单，且不存在隐私泄露问题，大大改善了用户的使用体验；设置声音检测单元，当音频信号的最大幅值超过预设的启动幅值时才使声纹认证系统启动工作，能够减小系统的待机功耗；采用UBM模型训练家庭成员的声纹模型，训练时间短，训练效率高。

基于总变化空间与分类器联合优化的说话人身份识别方法-201910439064.4
发明人：韩纪庆;陈晨;郑贵滨;郑铁然 -专利权人：哈尔滨工业大学
申请日： 2019-05-24 - 公布日： 2021-03-23 - 主分类号： G10L17/12
摘要：基于总变化空间与分类器联合优化的说话人身份识别方法，它属于说话人识别技术领域。本发明解决了目前的总变化空间估计方法对说话人身份识别的等错误率高的问题。本发明首先求得训练集均值超矢量在初始总变化空间上的表示；然后对该表示进行长度规整，并输入分类器PLDA；接着在分类器PLDA的监督下，更新分类器的参数与总变化空间的参数，重复上述步骤，直至达到设置的最大迭代次数，获得最终的分类器参数与总变化空间参数；测试时，利用测试语音的均值超矢量和目标说话人的均值超矢量，计算其在总变化空间上的表示，然后对该表示进行长度规整，并计算其在分类器上的联合概率密度作为最终分类的依据。本发明可以应用于说话人识别技术领域。

一种语音校验方法和装置-201910838255.8
发明人：王愈;李健;张连毅;武卫东 -专利权人：北京捷通华声科技股份有限公司
申请日： 2019-09-05 - 公布日： 2021-02-19 - 主分类号： G10L17/12
摘要：本发明提供了一种语音校验方法和装置，所述方法包括：获取待校验的语音数据；对所述语音数据进行处理，获得所述语音数据的谱参数；根据所述谱参数及预先训练的目标声纹校验模型，确定所述谱参数对应的分值，其中，所述预先训练的目标声纹校验模型通过语音合成模型和声纹校验模型联合训练获得；在所述分值大于预设值的情况下，确定所述待校验的语音数据来自用户的真实语音。通过语音合成模型和声纹校验模型的联合训练得到目标声纹校验模型，对获取的语音数据进行校验，提高了对语音校验的准确性。

一种基于自适应语音帧加权的说话人识别方法-201910369970.1
发明人：邹霞;张星昱;孙蒙;吴彭龙;时文华;张雄伟;贾冲;李莉 -专利权人：中国人民解放军陆军工程大学
申请日： 2019-05-06 - 公布日： 2021-02-09 - 主分类号： G10L17/12
摘要：本发明提供一种基于自适应语音帧加权的说话人识别方法，利用带噪语音段中存在的各语音帧信噪比不一致的特性，将信噪比高的语音帧加重权，信噪比低的帧加弱权，并将其提取为对应的MFCC特征，从而构建出含有帧加权信息的GMM并提取i‑vector。在此基础上实现了说话人识别任务，使得说话人识别在噪声环境下依然有较好的性能。

由计算机实施的语音命令验证方法及电子装置-202010161382.1
发明人：伊夫林柯尼亚瓦堤;沙席拉吉索马拉金 -专利权人：美律电子（深圳）有限公司
申请日： 2020-03-10 - 公布日： 2020-07-28 - 主分类号： G10L17/12
摘要：本发明提供一种由计算机实施的语音命令验证方法。该方法包括：获得声音讯号流；计算声音讯号流的讯号噪声比(SNR)值；将声音讯号流转换成梅尔频率倒频谱系数(MFCC)流；根据梅尔频率倒频谱系数流及根据由高斯混合模型‑通用背景模型(GMM‑UBM)产生的多个样本流中的一者计算与梅尔频率倒频谱系数流对应的动态时间扭曲(DTW)距离；根据梅尔频率倒频谱系数流及样本流计算与梅尔频率倒频谱系数流对应的对数似然比(LLR)值作为高斯混合模型‑通用背景模型得分；根据高斯混合模型‑通用背景模型得分、动态时间扭曲距离及讯号噪声比值判断声音讯号流是否通过语音命令验证；响应于判定声音讯号流通过语音命令验证，判定声音讯号流是自合法使用者发出的语音流。

使用自适应阈值的说话者识别-201780021698.7
发明人：纳拉彦·比斯瓦尔;格克肯·西林吉尔 -专利权人：英特尔公司
申请日： 2017-02-21 - 公布日： 2018-11-23 - 主分类号： G10L17/12
摘要：讨论了与说话者识别相关的技术。这种技术可以包括基于对应于所接收的音频的语音噪声比和噪声类型标签来确定自适应说话者识别阈值，并且基于自适应说话者识别阈值和对应于所接收的音频的说话者识别分数来执行说话者识别。

一种说话人识别方法及系统-201210555152.9
发明人：周若华;颜永红;梁春燕;杨琳 -专利权人：中国科学院声学研究所;北京中科信利技术有限公司
申请日： 2012-12-19 - 公布日： 2013-05-01 - 主分类号： G10L17/12
摘要：本发明涉及一种说话人识别方法，所述方法包括：通过训练得到邻域保持嵌入空间矩阵；基于所述邻域保持嵌入空间矩阵进行说话人识别；所述基于所述邻域保持嵌入空间矩阵进行说话人识别，包括：对于每一个高斯混合模型GMM均值超向量x进行主成分分析PCA降维得到向量w；使用所述邻域保持嵌入空间矩阵对于每一个所述向量w进行映射得到向量w’；将经过映射得到的所述向量w’作为支持向量机SVM的输入特征进行后端分类建模；借助支持向量机SVM打分，根据打分结果识别说话人。本发明实施例采用一种新型的基于邻域保持嵌入NPE的因子分析技术，能够有效地克服现有总变化因子分析技术存在的不足，进一步提高说话人识别性能。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音校验方法和装置有效

专利文献下载