[发明专利]一种基于伪说话人聚类的语音情感特征规整化方法有效
申请号: | 201310534319.8 | 申请日: | 2013-11-01 |
公开(公告)号: | CN103531198A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 黄程韦;赵力;魏昕;王浩;查诚;余华 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L25/63 |
代理公司: | 江苏永衡昭辉律师事务所 32250 | 代理人: | 王斌 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 说话 人聚类 语音 情感 特征 规整 方法 | ||
技术领域
本发明涉及一种语音情感识别方法,特别涉及一种基于伪说话人聚类的语音情感特征规整化方法。
背景技术
语音情感识别技术的研究正在从以往的实验室条件转向真实世界中的实际应用。以往的情感识别研究往往是依据表演方式采集的语料库,其中的情感类别数量较少,大部分为基本情感类别,说话人的数量也相对较少。而在一些实际应用中,需要涉及到大量非特定说话人的情感语音,这就需要情感识别系统具有非特定说话人的鲁棒性。
以话务中心的语音数据处理为例,在银行、电信等大型服务行业领域,客户的满意度是一个重要的业务指标,因此在话务中心需要对客服通话进行录音,以便于分析和考核服务质量。然而对于大量的情感语音,很难进行人工听辨,通过自动识别的方式则可以快速的对录音数据进行筛选,识别出客户的情感信息。在这样的应用中,涉及到大量的非特定说话人,由于情感的个性化差异较大,会导致情感特征的复杂度增加,情感建模的困难加大,因此有必要研究非特定说话人的特征规整化技术。
很多规整化技术都可以用于提高一个识别系统的性能,在说话人识别、语种识别和自动语音识别中有很多的应用。在说话人识别技术中,倒谱均值减法(CepstralMeanSubtraction,CMS)经常用于镁尔倒谱系数,以降低信道方差。还有些研究者在说话人识别中考虑了情感因素的影响,并且提出了情感规整化技术来提高说话人识别系统的性能。
基于性别差异的规整化也是一类常见的降低说话人之间的特征差异的规整化技术,近年来不少文献将性别规整化用于语音情感识别系统中,获得了较好的性能提升效果。
Sethu等人较早的研究了语音情感识别系统中的说话人规整化问题,他们提出的特征规整化技术使得识别率平均提高了百分之六左右。然而他们的实验中涉及到的说话人数量较少,仅有七人。Vlasenko等人,在SUSAS情感语音库和柏林库上的实验中应用了说话人规整化技术(SpeakerNormalization,SN)。SN技术在柏林库上获得了百分之五的识别率提升。然而在很多实际场合中,说话人的身份是未知的,这就给SN技术的应用带来了困难。
发明内容
本发明的目的就在于针对上述现有特征规整化技术的缺陷,设计一种基于伪说话人聚类的情感特征规整化方法。本发明的技术方案是:
一种基于伪说话人聚类的语音情感特征规整化方法,其主要技术步骤为:
提取出能够反映说话人信息的特征空间;在此说话人特征空间内进行模糊聚类,自动获得情感语料中的说话人的身份信息;据此信息进行“伪说话人”分组,每一条样本按照其相似程度划分到不同的伪说话人分组中;根据每条样本的伪说话人组别信息,进行情感特征的规整化;在规整化后的数据中加入相应组别的模糊隶属度信息。通过这样的说话人聚类规整化处理,情感特征空间中的样本分布更加清晰有效,降低了大量说话人带来的特征差异,适合应用于非特定说话人情感识别。
(1)对说话人敏感的特征空间的提取:
(1-1)从情感语料中提取481个基本声学特征参数,这里构造的特征参数,是针对语音情感识别的,并不是为说话人识别设计的。在整个语料上的统计特征,适合于语音情感识别。
(1-2)提取的这些特征参数,会受到说话人因素的影响,说话人数量的增加,会使得情感特征中的方差增大。将这些原始的声学特征变换到一个对说话人敏感的特征空间中,将说话人因素的影响体现出来。通过PCA与LDA变换,使得每个说话人之间的可区分度最大化,得到说话人敏感的特征空间。
(2)说话人模糊聚类
(2-1)在得到的对说话人敏感的特征空间中,情感数据样本的分布反映出其受到说话人因素影响的大小,样本聚合之处为同样的说话人的数据,样本分离之处代表了不同的说话人的数据。同过模糊聚类算法,在特征空间内进行的情感样本自动聚类,获得说话人身份信息。通过聚类得到的说话人身份信息有一定的错误分类存在,是一种“伪说话人聚类”。
(2-2)在完成了说话人的聚类后,将每条语料的聚类组别作为说话人身份的标识号。
(3)伪说话人情感特征规整化
(3-1)在原始的481维特征空间中进行规整化处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310534319.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:开关电源装置
- 下一篇:一种公路交叉道口交通信号灯的智能控制方法