[发明专利]一种声纹识别相似度评分的方法和装置有效

申请号：	201511016012.4	申请日：	2015-12-29
公开（公告）号：	CN105679324B	公开（公告）日：	2019-03-22
发明（设计）人：	黄建鹏;蔡智力;王子亮;王捷;邹应双	申请（专利权）人：	福建星网视易信息系统有限公司
主分类号：	G10L17/08	分类号：	G10L17/08;G10L17/12;G10L17/02;G10L17/04
代理公司：	福州市景弘专利代理事务所(普通合伙) 35219	代理人：	林祥翔;吕元辉
地址：	350008 福建省福州市仓山区金山***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种声纹识别相似度评分方法和装置，其中方法包括如下步骤：获取声纹数据，并将声纹数据与语料库中所有的声音模型进行匹配，得到第二声纹识别得分集合；语料库中的各个对象的语料子集中挑选若干音频数据与语料库中所有的声音模型进行匹配，得到各自的第一声纹识别得分集合；根据第二声纹识别得分集合的高低顺序分配对应的第一得分系数集合；根据第一声纹识别得分集合和第二声纹识别得分集合计算对应的第二得分系数集合。本发明通过第一声纹识别得分和第二声纹识别得分并算上权重，对声纹识别进行综合性评定，使得评定的得分结果稳定，区分度高，不易出现声纹识别结果相差大的问题。
搜索关键词：	一种声纹识别相似评分方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种声纹识别相似度评分的方法，其特征在于，包括如下步骤：在语料库中的各个对象的语料子集内挑选若干音频数据与语料库中所有的声音模型进行匹配，得到各自的第一声纹识别得分集合；获取声纹数据，并将声纹数据与语料库中所有的声音模型进行匹配，得到第二声纹识别得分集合；根据第二声纹识别得分集合的高低顺序分配对应的第一得分系数集合；根据第一声纹识别得分集合和第二声纹识别得分集合，计算语料库中每个对象的声纹识别得分集合与第二声纹识别得分集合的相关性系数，并根据相关性系数的高低顺序分配对应的第二得分系数集合；根据第一得分系数集合、第二得分系数集合和二者对应的得分权重算出最终得分集合；将最终得分集合中最高得分作为声纹相似度的得分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于福建星网视易信息系统有限公司，未经福建星网视易信息系统有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201511016012.4/，转载请声明来源钻瓜专利网。

上一篇：具有软解码优化的可重写多比特非易失性存储器
下一篇：语音识别方法、装置及终端

同类专利

一种基于DBSCAN算法的声纹识别方法-201610561186.7
发明人：唐家博;张雪洁;黄星期;金薛冬;李瑞;李智 -专利权人：河海大学
申请日： 2016-07-15 - 公布日： 2019-10-15 - 主分类号： G10L17/08
摘要：本发明公开了一种基于DBSCAN算法的声纹识别方法，包括语音特征的提取，语音片段相似度的评价，训练集语音的筛选，对检验语音的判断算法。其中，语音特征提取采用mel倒谱系数进行特征提取；语音相似度评价采用余弦相似度进行相似度的计算；训练语音的筛选采用固定阈值进行筛选；对检验语音的判断利用改进的DBSCAN算法进行判断。本发明基于DBSCAN算法的声纹识别方法，不需要很庞大的训练集，只需要一些经过筛选的训练语音作为训练集即可，并且利用这些训练语音的分布特性对检验语音进行判别，具有十分良好的用户体验和较高的识别率。

一种声纹识别方法和装置-201610416650.3
发明人：李为;钱柄桦;金星明;李科;吴富章;吴永坚;黄飞跃 -专利权人：腾讯科技（深圳）有限公司
申请日： 2016-06-12 - 公布日： 2019-07-16 - 主分类号： G10L17/08
摘要：本发明实施例公开了一种声纹识别方法和装置，其中所述方法包括：获取验证用户朗读第一字符串所产生的验证语音信息；对所述验证语音信息进行语音识别得到所述验证语音信息中包含的分别与所述第一字符串中的多个字符对应的语音片段；提取各个字符对应的语音片段的声纹特征；根据所述各个字符对应的语音片段的声纹特征，结合预设的相应字符对应的通用背景模型训练得到验证语音信息中各个字符对应的特征向量；计算验证语音信息中各个字符对应的特征向量与预设的注册语音信息中相应字符对应的特征向量的相似度分数，若所述相似度分数达到预设验证门限，则将所述验证用户确定为所述注册语音信息对应的注册用户。采用本发明，可有效提高声纹识别准确率。

语音数据处理方法和装置-201610178300.8
发明人：金星明;李为;郑昉劢;吴富章;朱碧磊;钱柄桦;李科;吴永坚;黄飞跃 -专利权人：腾讯科技（深圳）有限公司
申请日： 2016-03-25 - 公布日： 2019-04-12 - 主分类号： G10L17/08
摘要：本发明公开了一种语音数据处理方法和装置。该方法包括：获取多个语音样本中每个语音样本的I‑Vector向量，并确定多个语音样本中的目标种子样本；分别计算目标种子样本的I‑Vector向量与目标剩余语音样本的I‑Vector向量之间的余弦距离，目标剩余语音样本为多个语音样本中除目标种子样本之外的语音样本；至少按照余弦距离从多个语音样本或目标剩余语音样本中过滤得到目标语音样本，目标语音样本的I‑Vector向量与目标种子样本的I‑Vector向量之间的余弦距离高于第一预定阈值。本发明解决了相关技术无法采用人工标注方法对语音数据进行清洗导致语音数据清洗效率低的技术问题。

一种声纹识别相似度评分的方法和装置-201511016012.4
发明人：黄建鹏;蔡智力;王子亮;王捷;邹应双 -专利权人：福建星网视易信息系统有限公司
申请日： 2015-12-29 - 公布日： 2019-03-22 - 主分类号： G10L17/08
摘要：本发明公开一种声纹识别相似度评分方法和装置，其中方法包括如下步骤：获取声纹数据，并将声纹数据与语料库中所有的声音模型进行匹配，得到第二声纹识别得分集合；语料库中的各个对象的语料子集中挑选若干音频数据与语料库中所有的声音模型进行匹配，得到各自的第一声纹识别得分集合；根据第二声纹识别得分集合的高低顺序分配对应的第一得分系数集合；根据第一声纹识别得分集合和第二声纹识别得分集合计算对应的第二得分系数集合。本发明通过第一声纹识别得分和第二声纹识别得分并算上权重，对声纹识别进行综合性评定，使得评定的得分结果稳定，区分度高，不易出现声纹识别结果相差大的问题。

用音频特征主成分建立的语音群集来识别说话人的方法-201811118265.6
发明人：陈永清;陈东风;王贵珊;李瑞娟 -专利权人：新巴特（安徽）智能科技有限公司
申请日： 2018-09-26 - 公布日： 2018-12-21 - 主分类号： G10L17/08
摘要：本发明公开了一种用音频特征主成分建立的语音群集来识别说话人的方法，该方法是将主成分分析和基于音频特征在主分量空间中的欧几里得距离的层次聚类相结合，具体为：收集不同的训练音频样本集；计算每个样本的时域和频域音频特征；计算出时域和频域音频特征的平均值和标准偏差；通过计算出的数据对训练样本进行主成分分析；将每个音频由音频特征数据沿着上述N个主成分投影的坐标来代表；采用UPGMA聚类分析算法，基于n维空间中的距离对说话人进行聚类。本发明的方法具有速度快，添加新说话人语音方便的特点，用于智能语言教学系统，实现了说话人识别，从未知的多个发言者会话中及时分辨说话人，利于针对性的教学。

对讲方法、装置及系统-201710768017.5
发明人：仇波 -专利权人：长沙世邦通信技术有限公司
申请日： 2017-08-30 - 公布日： 2018-09-18 - 主分类号： G10L17/08
摘要：本发明提供了一种对讲方法、装置及系统，涉及对讲的技术领域，该方法包括：获取当前时刻请求对讲连接的第一请求信息，其中，第一请求信息为音频请求信息；对音频请求信息进行声音分析，得到声音分析结果，其中，声音分析至少包括以下之一：语音分析、声纹分析、音量分析；根据声音分析结果，确定请求对讲连接的第一应答优先级，以便应答人员基于第一应答优先级对请求对讲连接进行应答。本发明缓解了传统的对讲系统处理事件滞后和给工作人员带来较大工作负荷的技术问题。

一种基于动态时间规整和语音活动检测的声纹识别方法-201810050276.9
发明人：唐滢淇;董树锋 -专利权人：浙江大学
申请日： 2018-01-18 - 公布日： 2018-07-27 - 主分类号： G10L17/08
摘要：本发明公开了一种基于动态时间规整和语音活动检测的声纹识别方法，首先，采用语音活动检测方法录制语音，并对语音进行裁剪处理，滤除空白语音和异常语音；然后计算所得样本的梅尔倒谱系数，提取目标语音的特征；再者，录制模板语音，并使用动态时间归整算法计算差异度；最后所述语音录制方法录制待识别语音，并使用所述目标语音特征提取方法提取语音特征，再将目标语音逐一与已存在的模板语音进行比对，实现声纹识别的目标。与现有的声纹识别方法相比，本发明提出的声纹识别方法不需要过多的语音样本来建立声纹识别模型，同时对于低性能处理器和便携式设备友好，能够加快识别速度，减少资源占用，实现声纹离线识别。

复杂噪音下的声纹识别系统-201611231657.4
发明人：张学阳 -专利权人：张学阳
申请日： 2016-12-23 - 公布日： 2018-07-03 - 主分类号： G10L17/08
摘要：本发明涉及到了一种基于声纹识别技术的密码锁系统，该系统主要有不同背景噪音下的语音采集模块，背景噪音区分模块，背景噪音滤除模块，语音端点检测模块，语音MFCC特征提取模块，VQ多模型训练模块，语音识别判断命令词模块，说话人判别模块。该系统有两大特点，一是在说话人预处理阶段通过特定的识别算法能够将背景噪音进行分类，并且分别进行处理，从而达到了在复杂背景噪音具有可识别能力；二是在语音的模型训练阶段，对于说话人不同的训练语句分别构建模型，在识别阶段引入语音识别技术来识别语音内容，然后与对应的模型进行匹配，从而大大提高了声纹识别的准确率。本发明适应能力以及抗干扰能力强，识别精度高。

用于与文本相关的说话者验证的双重评分方法及系统-201310214139.1
发明人：安东尼·拉尔彻;李功益;马斌;蔡玉翠香 -专利权人：新加坡科技研究局
申请日： 2013-05-31 - 公布日： 2018-06-01 - 主分类号： G10L17/08
摘要：本发明提供说话者验证系统及方法。该方法包括接收说话者话语并响应话语确定与文本无关的说话者验证分数和与文本相关的说话者验证分数。还包括响应于与文本相关的说话者验证分数和与文本无关的说话者验证分数之间关系来确定与UBM无关的说话者标准化分数，并且对于各话语将与UBM无关的说话者验证分数和与文本相关的说话者验证分数映射至二维分数空间，其分成与接受分数、不明确分数和拒绝分数对应的三个集群。用于说话者验证置信分数生成的二进制决策树被通过识别二进制决策树各节点的逻辑函数识别，并且通过在各节点处执行逻辑函数以对应于话语生成该置信分数，以将话语的与文本相关的说话者验证分数和与UBM无关的说话者验证分数映射到二进制决策。

一种基于多人说话的声纹识别方法-201610024134.6
发明人：祝铭明 -专利权人：芋头科技（杭州）有限公司
申请日： 2016-01-14 - 公布日： 2017-07-21 - 主分类号： G10L17/08
摘要：本发明公开了一种基于多人说话的声纹识别方法，属于生物识别技术领域；该声纹识别方法，可在多人同时说话时，可对声源进行分解，获取每个说话人的语音，将每个人的语音与预设的频段进行匹配，根据匹配相似度识别出需要识别的说话人的语音，在对该语音进行声纹识别，计算量较小，能够节省存储和计算资源，识别的准确率高，并且克服了基于概率统计的建模方法存在的问题，适合于系统资源有限的智能系统使用。同时预先设置了表示儿童的说话人的第一频率以及表示成年的说话人的第二频率并分别进行比较，进一步提升了基于多人说话的声纹识别的准确度。

基于声纹识别帮助失聪患者判断声音类别的方法-201610141941.6
发明人：钦赛勇 -专利权人：无锡吾芯互联科技有限公司
申请日： 2016-03-11 - 公布日： 2016-08-03 - 主分类号： G10L17/08
摘要：本发明涉及一种基于声纹识别帮助失聪患者判断声音类别的方法，其包括如下步骤：步骤1、对每个模板声音进行特征矢量提取，以得到每个模板声音对应的模板声音特征矢量；步骤2、对环境声音进行特征矢量提取，以得到环境声音的环境声音特征矢量；步骤3、将环境声音特征矢量与模板声音特征矢量库内的模板声音特征矢量通过DTW动态时间规整方法进行一一比对，以得到若干声音比对欧式距离；步骤4、确定上述声音比对欧式距离中的最小声音比对欧式距离以及与最小声音比对欧式距离对应的模板声音，则环境声音的类别为与最小声音比对欧式距离对应的模板声音。本发明能有效识别声音的类别，有助于失聪患者对语音识别的能力，适应范围广，安全可靠。

通话声音识别方法及装置-201310728622.1
发明人：雷杨;华国栋;王勿英 -专利权人：三亚中兴软件有限责任公司
申请日： 2013-12-25 - 公布日： 2015-07-01 - 主分类号： G10L17/08
摘要：本发明公开了通话声音识别方法及装置，其中，该方法包括获取进行通话的通话对象的声音样本；将该声音样本与声音模型库中的声音进行比较；根据比较结果对通话声音进行识别。通过本发明解决了相关技术中终端因不能通过通话声音辨别对端通话人的身份，容易导致诈骗事件发生的问题，实现了终端能够通过通话声音辨别对端通话人的身份，提高了安全性。

一种声纹特征融合方法及装置-201410408952.7
发明人：刘镝;张云勇;张尼 -专利权人：中国联合网络通信集团有限公司
申请日： 2014-08-19 - 公布日： 2014-12-03 - 主分类号： G10L17/08
摘要：本发明公开了一种声纹特征融合方法及装置，该方法包括：在用户的多种声纹特征向量中，分别计算用户任意两种声纹特征向量之间的平均KL距离；其中，两种声纹特征向量的平均KL距离为：第一声纹特征向量、第二声纹特征向量的概率分布的KL距离，与所述第二声纹特征向量、所述第一声纹特征向量的概率分布的KL距离相加后除以2；选择平均KL距离最大的两种声纹特征进行融合。本发明利用声纹特征向量之间的平均KL距离表示两种特征融合的有效信息量，更加精准地选择可分性信息大的两种特征实现融合，能更好地实现个人身份认证的功能，提高认证的精度。

一种基于45度斜线滚动的动态时间规整方法和系统-201210553170.3
发明人：许云峰 -专利权人：联芯科技有限公司
申请日： 2012-12-18 - 公布日： 2014-06-18 - 主分类号： G10L17/08
摘要：本发明提供了一种基于45度斜线滚动的动态时间规整方法和系统，包括：对矢量距离矩阵进行45度斜线路径搜索；将搜索到的第一45度斜线路径的每个节点和第二45度斜线路径的每个节点进行矢量距离累积量初始化；根据所述第一45度斜线路径和所述第二45度斜线路径的矢量距离累积量计算第三45度斜线路径的每个节点的矢量距离累积量；依序滚动递归，根据所述第(N-2)45度斜线路径和所述第(N-1)45度斜线路径的矢量距离累积量计算第N45度斜线路径矢量距离累积量，第N45度斜线路径上的节点即为矢量距离矩阵的最优路径，其中N为自然数且N大于3。通过45度斜线路径依序滚动递归的方式大大减少了动态时间规整算法所需要的缓存空间，从而大大减少了成本。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种声纹识别相似度评分的方法和装置有效

专利文献下载