[发明专利]用于讲话者验证的方法与系统无效
申请号: | 200510097649.0 | 申请日: | 2005-08-29 |
公开(公告)号: | CN1924998A | 公开(公告)日: | 2007-03-07 |
发明(设计)人: | 黄伟;韩兆兵;张亚昕 | 申请(专利权)人: | 摩托罗拉公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 李涛;钟强 |
地址: | 美国伊*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于讲话者验证的方法与系统,对于验证诸如讲话者的身份等讲话者属性是有用的。在无明显可辨话音与有明显可辨话音(U/V)语音分类器中对输入训练语音信号进行分类,以输出干净的V语音分量,并对输入测试语音信号进行分类,以输出嘈杂的U语音分量(605)。使用干净的V语音分量从通用背景模型(UBM)生成干净目标模型(CTM)(610)。使用嘈杂的U语音分量从CTM生成嘈杂目标模型(NTM)(615)。计算初始CTM匹配分值,以来自UBM的匹配分值输出对其进行归一化,创建第一初步匹配分值(620)。计算初始NTM匹配分值,以来自UBM的匹配分值输出对其进行归一化,创建第二初步匹配分值(625)。使用第一与第二初步匹配分值确定最终匹配分值(630)。 | ||
搜索关键词: | 用于 讲话 验证 方法 系统 | ||
【主权项】:
1.一种用于讲话者验证的方法,其包括:使用无明显可辨话音与有明显可辨话音(U/V)语音分类器,对输入训练语音信号进行分类,以输出干净的有明显可辨话音的语音分量,并对输入测试语音信号进行分类,以输出嘈杂的无明显可辨话音的语音分量;使用所述的干净的有明显可辨话音语音分量从通用背景模型(UBM)生成干净目标语音模型(CTM);使用所述的嘈杂的无明显可辨话音语音分量从所述CTM生成嘈杂目标语音模型(NTM);为所述输入测试语音信号计算初始CTM匹配分值,并以来自所述UBM的匹配分值输出对其进行归一化,以创建第一初步匹配分值;为所述输入测试语音信号计算初始NTM匹配分值,并以来自所述UBM的匹配分值输出对其进行归一化,以创建第二初步匹配分值;和使用所述第一与第二初步匹配分值确定最终匹配分值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于摩托罗拉公司,未经摩托罗拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510097649.0/,转载请声明来源钻瓜专利网。