[发明专利]使用自适应阈值的说话者识别在审
申请号: | 201780021698.7 | 申请日: | 2017-02-21 |
公开(公告)号: | CN108885873A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 纳拉彦·比斯瓦尔;格克肯·西林吉尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L17/12 | 分类号: | G10L17/12;G10L17/20;G10L21/02 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宗晓斌 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 讨论了与说话者识别相关的技术。这种技术可以包括基于对应于所接收的音频的语音噪声比和噪声类型标签来确定自适应说话者识别阈值,并且基于自适应说话者识别阈值和对应于所接收的音频的说话者识别分数来执行说话者识别。 | ||
搜索关键词: | 说话 自适应 噪声类型 噪声比 标签 语音 | ||
【主权项】:
1.一种用于说话者识别的计算机实现的方法,包括:基于所接收的音频输入来确定说话者识别分数;基于所述所接收的音频输入来生成语音噪声比;生成对应于所述所接收的音频输入的噪声类型标签;至少部分地基于所述语音噪声比和所述噪声类型标签来确定自适应说话者识别阈值;以及基于对所述说话者识别分数与所述说话者接受阈值的比较来针对所述所接收的音频输入执行说话者识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780021698.7/,转载请声明来源钻瓜专利网。
- 上一篇:应答生成装置、对话控制系统以及应答生成方法
- 下一篇:信息处理装置和方法
- 同类专利
- 使用自适应阈值的说话者识别-201780021698.7
- 纳拉彦·比斯瓦尔;格克肯·西林吉尔 - 英特尔公司
- 2017-02-21 - 2018-11-23 - G10L17/12
- 讨论了与说话者识别相关的技术。这种技术可以包括基于对应于所接收的音频的语音噪声比和噪声类型标签来确定自适应说话者识别阈值,并且基于自适应说话者识别阈值和对应于所接收的音频的说话者识别分数来执行说话者识别。
- 一种说话人识别方法及系统-201210555152.9
- 周若华;颜永红;梁春燕;杨琳 - 中国科学院声学研究所;北京中科信利技术有限公司
- 2012-12-19 - 2013-05-01 - G10L17/12
- 本发明涉及一种说话人识别方法,所述方法包括:通过训练得到邻域保持嵌入空间矩阵;基于所述邻域保持嵌入空间矩阵进行说话人识别;所述基于所述邻域保持嵌入空间矩阵进行说话人识别,包括:对于每一个高斯混合模型GMM均值超向量x进行主成分分析PCA降维得到向量w;使用所述邻域保持嵌入空间矩阵对于每一个所述向量w进行映射得到向量w’;将经过映射得到的所述向量w’作为支持向量机SVM的输入特征进行后端分类建模;借助支持向量机SVM打分,根据打分结果识别说话人。本发明实施例采用一种新型的基于邻域保持嵌入NPE的因子分析技术,能够有效地克服现有总变化因子分析技术存在的不足,进一步提高说话人识别性能。
- 专利分类