[发明专利]一种基于核半监督判别分析的语音情感识别方法有效

申请号：	201310549224.3	申请日：	2013-11-07
公开（公告）号：	CN103544963A	公开（公告）日：	2014-01-29
发明（设计）人：	郑文明;徐新洲;赵力;魏昕;余华;黄程韦;刘健刚	申请（专利权）人：	东南大学
主分类号：	G10L25/63	分类号：	G10L25/63;G10L15/02;G10L15/08
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	杨晓玲
地址：	211189 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于核半监督判别分析的语音情感识别方法，对经预处理的语音样本中语音情感特征提取后，进行特征筛选、KSDA维数约简和分类。在训练阶段，对全监督训练样本集使用KSDA进行维数约简，将表示训练样本不同关系信息的嵌入图结合起来，并使用核化数据映射，实现对语音情感特征维数约简的优化，再用低维样本训练多类SVM分类器；在测试阶段，依次使用训练阶段特征筛选得到的特征及维数约简得到的数据映射方式，对各测试样本获取其低维特征，再使用训练得到的分类器进行分类判决，得到测试样本的类别。与现有方法相比，本发明的方法在语音情感特征维数约简中增加了降维的有效性，使语音情感识别系统的识别率性能得到了提升。
搜索关键词：	一种基于监督判别分析语音情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于核半监督判别分析的语音情感识别方法，其特征在于：将语音情感数据库中若干个语音样本任意划分为训练样本集和测试样本集，包括顺序执行的以下步骤：步骤一，语音样本预处理：对语音样本进行预加重，然后对预加重后的语音样本的时域信号进行分帧；步骤二，语音情感特征提取：提取经步骤一处理后的每个语音样本中的语音情感特征，按照提取方式的不同分为能量、基音、过零率、时长、共振峰和Mel频率倒谱系数共6大类语音情感特征组成每个语音样本的原始语音情感特征向量；对所述6大类语音情感特征的每一维特征进行规整化处理后组成每个语音样本的规整化语音情感特征向量；步骤三，特征筛选：对步骤二中得到的规整化语音情感特征向量中每个特征维数的FDR值进行特征筛选，去除规整化语音情感特征向量中对语音情感分析贡献较小的特征，得到每个语音样本的特征筛选后语音情感特征向量；步骤四，基于KSDA的特征维数约简：对经步骤三特征筛选后得到的训练样本的特征筛选后语音情感特征向量集X＝[x₁,x₂,...,x_N]使用KSDA对X进行维数约简训练，生成核方法的降维映射阵A，同时求解得到X的低维样本集A^TK，Gram阵K选用Gauss核函数；步骤五，训练两类SVM分类器：假设训练样本集中有N个分属于N_c个种类的语音样本，在训练样本集中任取两个种类的语音样本，进行组合训练得到1个两类SVM分类器，共得到N_c(N_c-1)/2个两类SVM分类器；步骤六，测试：利用经步骤五训练完成的SVM分类器每个测试样本进行测试，具体包括顺序执行的以下步骤：（1）对经步骤三得到的每个测试样本的特征筛选后语音情感特征向量使用核方法的降维映射阵A进行维数约简，得到经过维数约简后的低维样本为A^TK_i，对于一个测试样本Ki=[K(xitest,x1),K(xitest,x2),...,K(xitest,xN)]T,]]>Gram阵K选用步骤四中所述的Gauss核函数；（2）使用多类SVM分类器投票进行分类：将每个测试样本的低维样本A^TK_i经所有得到的两类SVM分类器分类之后得到N_c(N_c-1)/2个判断结果，得票最多的判断结果即判决为对应的测试样本所属的情感类别；若出现相同最多票数，则仅选择由最多票数所对应的情感类别两两组成的两类SVM分类器重新对该测试样本的低维样本进行判断，得到新一轮判断结果，上述方法依次递减两类SVM分类器的个数直到得到一个唯一的最多票数即判决为对应测试样本所属的情感类别；如一个测试样本的低维样本按此过程仍有相同最大票数的类别判决时，则在这几类中随机决定对应测试样本的类别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310549224.3/，转载请声明来源钻瓜专利网。

上一篇：电解金属锰、二氧化锰生产中浸出渣综合回收利用的工艺
下一篇：一种红鳍东方魨卵巢细胞系体外构建方法及其应用

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于核半监督判别分析的语音情感识别方法有效

专利文献下载