[发明专利]一种基于伪说话人聚类的语音情感特征规整化方法有效

申请号：	201310534319.8	申请日：	2013-11-01
公开（公告）号：	CN103531198A	公开（公告）日：	2014-01-22
发明（设计）人：	黄程韦;赵力;魏昕;王浩;查诚;余华	申请（专利权）人：	东南大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L25/63
代理公司：	江苏永衡昭辉律师事务所 32250	代理人：	王斌
地址：	210096***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于说话人聚类语音情感特征规整方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于伪说话人聚类的语音情感特征规整化方法，其特征在于包括以下步骤：

步骤1，对说话人敏感的特征空间的提取；

步骤2，说话人模糊聚类；

步骤3，伪说话人情感特征规整化。

2.根据权利要求1所述的基于伪说话人聚类的语音情感特征规整化方法，其特征在于，所述步骤1具体包括以下步骤：

步骤1-1，从情感语料中提取481个基本声学特征参数，这里构造的特征参数，是针对语音情感识别的，并不是为说话人识别设计的。在整个语料上的统计特征，适合于语音情感识别；

步骤1-2，提取的这些特征参数，会受到说话人因素的影响，说话人数量的增加，会使得情感特征中的方差增大。将这些原始的声学特征变换到一个对说话人敏感的特征空间中，将说话人因素的影响体现出来。通过PCA与LDA变换，使得每个说话人之间的可区分度最大化，得到说话人敏感的特征空间。

3.根据权利要求1所述的基于伪说话人聚类的语音情感特征规整化方法，其特征在于，所述步骤2具体包括以下步骤：

步骤2-1，在得到的对说话人敏感的特征空间中，情感数据样本的分布反映出其受到说话人因素影响的大小，样本聚合之处为同样的说话人的数据，样本分离之处代表了不同的说话人的数据。同过模糊聚类算法，在特征空间内进行的情感样本自动聚类，获得说话人身份信息。通过聚类得到的说话人身份信息有一定的错误分类存在，是一种“伪说话人聚类”；

步骤2-2，在完成了说话人的聚类后，将每条语料的聚类组别作为说话人身份的标识号。

4.根据权利要求1所述的基于伪说话人聚类的语音情感特征规整化方法，其特征在于，所述步骤3具体包括以下步骤：

步骤3-1，按照下面公式(1)在原始的481维特征空间中进行规整化处理：

fu,v′=fu,v(n)-fu,v‾1Nu,v-1Σm=1Nu,v(fu,v(m)-fu,v‾)2---(1)]]>