[发明专利]一种基于伪说话人聚类的语音情感特征规整化方法有效
申请号: | 201310534319.8 | 申请日: | 2013-11-01 |
公开(公告)号: | CN103531198A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 黄程韦;赵力;魏昕;王浩;查诚;余华 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L25/63 |
代理公司: | 江苏永衡昭辉律师事务所 32250 | 代理人: | 王斌 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 说话 人聚类 语音 情感 特征 规整 方法 | ||
1.一种基于伪说话人聚类的语音情感特征规整化方法,其特征在于包括以下步骤:
步骤1,对说话人敏感的特征空间的提取;
步骤2,说话人模糊聚类;
步骤3,伪说话人情感特征规整化。
2.根据权利要求1所述的基于伪说话人聚类的语音情感特征规整化方法,其特征在于,所述步骤1具体包括以下步骤:
步骤1-1,从情感语料中提取481个基本声学特征参数,这里构造的特征参数,是针对语音情感识别的,并不是为说话人识别设计的。在整个语料上的统计特征,适合于语音情感识别;
步骤1-2,提取的这些特征参数,会受到说话人因素的影响,说话人数量的增加,会使得情感特征中的方差增大。将这些原始的声学特征变换到一个对说话人敏感的特征空间中,将说话人因素的影响体现出来。通过PCA与LDA变换,使得每个说话人之间的可区分度最大化,得到说话人敏感的特征空间。
3.根据权利要求1所述的基于伪说话人聚类的语音情感特征规整化方法,其特征在于,所述步骤2具体包括以下步骤:
步骤2-1,在得到的对说话人敏感的特征空间中,情感数据样本的分布反映出其受到说话人因素影响的大小,样本聚合之处为同样的说话人的数据,样本分离之处代表了不同的说话人的数据。同过模糊聚类算法,在特征空间内进行的情感样本自动聚类,获得说话人身份信息。通过聚类得到的说话人身份信息有一定的错误分类存在,是一种“伪说话人聚类”;
步骤2-2,在完成了说话人的聚类后,将每条语料的聚类组别作为说话人身份的标识号。
4.根据权利要求1所述的基于伪说话人聚类的语音情感特征规整化方法,其特征在于,所述步骤3具体包括以下步骤:
步骤3-1,按照下面公式(1)在原始的481维特征空间中进行规整化处理:
其中u表示第u个特征值,v代表说话人聚类的组别,Nu,v为同一个说话人的样本数量,fu,v(n)为每个说话人的数据样本值,则是给定说话人的数据样本的中心,由下式(2)得到:
步骤3-2,在规整化后的样本的特征矢量中加入样本属于某个组别的模糊隶属度信息,对情感特征进行扩展。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310534319.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:开关电源装置
- 下一篇:一种公路交叉道口交通信号灯的智能控制方法