[发明专利]一种基于信息传递的说话人聚类方法有效
申请号: | 200710178363.4 | 申请日: | 2007-11-29 |
公开(公告)号: | CN101452704A | 公开(公告)日: | 2009-06-10 |
发明(设计)人: | 颜永红;吕萍;张翔 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 | 代理人: | 王 勇 |
地址: | 100080北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 传递 说话 人聚类 方法 | ||
技术领域
本发明属于语音识别技术领域,具体地说,本发明涉及一种说话人聚类方法。
背景技术
说话人聚类是近年来语音信号处理领域的一个研究热点,被广泛应用于语音识别和说话人识别等领域。这项技术通常与说话人分段一起应用,也就是通常所说的说话人分段聚类。说话人聚类就是将分段后的语音数据进行分类,将不同说话人的语音数据分配到不同的类里。
说话人聚类至今已有许多方法,可以分为两类:有监督算法和无监督算法。有监督聚类一般是指已知对话中说话人的个数,按照说话人的个数进行聚类;无监督说话人聚类一般是指对话中说话人的个数未知,聚类过程找到一个最优的聚类数目以及其相应的聚类结果。目前,说话人聚类领域最为广泛应用的是基于层次聚类框架的算法,层次聚类初始化计算所有语音段两两之间的距离,寻找距离最近的两段合并成一段,并更新计算其他语音段与该新语音段之间的距离,重复此过程直到得到所需要的聚类数目或者满足某一全局准则。但是,这种算法鲁棒性还有待提高。同时,此算法需要反复的计算各类与新类之间的距离(相似度),这增加了算法的运行时间。因此,现有的很多方法,都是基于此方法上的改进,目的是增强算法的鲁棒性和速度。
发明内容
本发明的目的是克服现有技术的不足,针对语音信号的特点,通过不断迭代计算各数据段之间的r值和a值,将这两个值作为两段之间的两种交互信息,形成信息传递,从而提出一种鲁棒且快速有效的新的无监督和有监督说话人聚类方法。
为实现上述发明目的,本发明提供的基于信息传递的说话人聚类方法(可参考图1)包括初始化过程和寻找聚类中心过程;
其中初始化过程包括如下步骤:
1)计算两两语音数据段(以下简称数据段)之间的相似度s(i,k),其中k≠i;
2)设定各数据段作为聚类中心的优先度s(k,k),其中k表示第k个数据段,将所有的有效值a(i,k)初始化为零,下文中将有效值(availability)简称为a值;
寻找聚类中心过程包括如下子步骤:
3)根据两两数据段之间的a值和各数据段的优先度,计算两两数据段之间的责任值r(i,k),下文中将责任值(responsibility)简称为r值;根据各数据段的r值,计算两两数据段之间的a值;
4)合并r值和a值,以该合并值决策聚类中心;
5)重复执行步骤3)、4),直到找到稳定的聚类中心,结束聚类,统计聚类数目;
以上各步骤中,i、k分别表示第i和第k个数据段。
上述技术方案中,所述步骤1)中,所述相似度由两两数据段的距离得出,所述距离可以是欧式距离、马氏距离、KL距离或GLR距离。
上述技术方案中,所述步骤2)中,所述各数据段作为聚类中心的优先度s(k,k)均设定为所有相似度的中值。
上述技术方案中,所述步骤3)中,计算两两数据段之间的责任值r(i,k)的方法如下:
上式中r(i,k)表示第i个数据段与第k个数据段的r值,N表示语音段的数目。
上述技术方案中,所述步骤3)中,计算两两数据段之间a值的方法如下:
当k=i时
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710178363.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置