[发明专利]一种基于核半监督判别分析的语音情感识别方法有效
申请号: | 201310549224.3 | 申请日: | 2013-11-07 |
公开(公告)号: | CN103544963A | 公开(公告)日: | 2014-01-29 |
发明(设计)人: | 郑文明;徐新洲;赵力;魏昕;余华;黄程韦;刘健刚 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/02;G10L15/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 杨晓玲 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于核半监督判别分析的语音情感识别方法,对经预处理的语音样本中语音情感特征提取后,进行特征筛选、KSDA维数约简和分类。在训练阶段,对全监督训练样本集使用KSDA进行维数约简,将表示训练样本不同关系信息的嵌入图结合起来,并使用核化数据映射,实现对语音情感特征维数约简的优化,再用低维样本训练多类SVM分类器;在测试阶段,依次使用训练阶段特征筛选得到的特征及维数约简得到的数据映射方式,对各测试样本获取其低维特征,再使用训练得到的分类器进行分类判决,得到测试样本的类别。与现有方法相比,本发明的方法在语音情感特征维数约简中增加了降维的有效性,使语音情感识别系统的识别率性能得到了提升。 | ||
搜索关键词: | 一种 基于 监督 判别分析 语音 情感 识别 方法 | ||
【主权项】:
1.一种基于核半监督判别分析的语音情感识别方法,其特征在于:将语音情感数据库中若干个语音样本任意划分为训练样本集和测试样本集,包括顺序执行的以下步骤:步骤一,语音样本预处理:对语音样本进行预加重,然后对预加重后的语音样本的时域信号进行分帧;步骤二,语音情感特征提取:提取经步骤一处理后的每个语音样本中的语音情感特征,按照提取方式的不同分为能量、基音、过零率、时长、共振峰和Mel频率倒谱系数共6大类语音情感特征组成每个语音样本的原始语音情感特征向量;对所述6大类语音情感特征的每一维特征进行规整化处理后组成每个语音样本的规整化语音情感特征向量;步骤三,特征筛选:对步骤二中得到的规整化语音情感特征向量中每个特征维数的FDR值进行特征筛选,去除规整化语音情感特征向量中对语音情感分析贡献较小的特征,得到每个语音样本的特征筛选后语音情感特征向量;步骤四,基于KSDA的特征维数约简:对经步骤三特征筛选后得到的训练样本的特征筛选后语音情感特征向量集X=[x1,x2,...,xN]使用KSDA对X进行维数约简训练,生成核方法的降维映射阵A,同时求解得到X的低维样本集ATK,Gram阵K选用Gauss核函数;步骤五,训练两类SVM分类器:假设训练样本集中有N个分属于Nc个种类的语音样本,在训练样本集中任取两个种类的语音样本,进行组合训练得到1个两类SVM分类器,共得到Nc(Nc-1)/2个两类SVM分类器;步骤六,测试:利用经步骤五训练完成的SVM分类器每个测试样本进行测试,具体包括顺序执行的以下步骤:(1)对经步骤三得到的每个测试样本
的特征筛选后语音情感特征向量使用核方法的降维映射阵A进行维数约简,得到
经过维数约简后的低维样本为ATKi,对于一个测试样本![]()
K i = [ K ( x i test , x 1 ) , K ( x i test , x 2 ) , . . . , K ( x i test , x N ) ] T , ]]> Gram阵K选用步骤四中所述的Gauss核函数;(2)使用多类SVM分类器投票进行分类:将每个测试样本的低维样本ATKi经所有得到的两类SVM分类器分类之后得到Nc(Nc-1)/2个判断结果,得票最多的判断结果即判决为对应的测试样本所属的情感类别;若出现相同最多票数,则仅选择由最多票数所对应的情感类别两两组成的两类SVM分类器重新对该测试样本的低维样本进行判断,得到新一轮判断结果,上述方法依次递减两类SVM分类器的个数直到得到一个唯一的最多票数即判决为对应测试样本所属的情感类别;如一个测试样本的低维样本按此过程仍有相同最大票数的类别判决时,则在这几类中随机决定对应测试样本的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310549224.3/,转载请声明来源钻瓜专利网。