[发明专利]一种识别语音情感的装置和方法在审

申请号：	201610091015.2	申请日：	2016-02-19
公开（公告）号：	CN105609117A	公开（公告）日：	2016-05-25
发明（设计）人：	郑洪亮	申请（专利权）人：	郑洪亮
主分类号：	G10L25/63	分类号：	G10L25/63;G10L15/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	215000 江苏省苏州***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种识别语音情感装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音信号处理领域，尤其涉及一种识别语音情感的装置和方法。

背景技术

语音情感的识别技术是指机器通过语音信号智能识别人类的不同情感状态，根据人在不同情感下的语音信号非平稳性特征等比较明显的特点，通过提取语音的音质特征、韵律特征和频谱特征等声学特征来判断情绪的变化。语音情感识别是人工智能、心理学和生物学等多学科交叉的新兴领域，其目的就是通过计算机技术将蕴含在语音中的情感信息识别出来(同样一句话，说话人在不同的环境和情感状态时所表达的含义会截然不同)。语音信号具有便携性好和采集方便等优势，因此情感识别技术在智能人机交互、人机交互教学、娱乐业、医学、刑侦与安全领域可以得到广泛的应用。

对人员情绪状态的评价具有很高的应用价值，特别是在航空航天等军事应用领域中，长时间的、枯燥的、高强度的任务会使相关人员面临严酷的生理以及心理考验，引发一些负面的情绪。探讨负面情绪对于人类认知活动的作用机制和影响因素，研究提高个体认知和工作效率的方法、避免影响认知和工作能力的因素，具有重大的实际意义。

一般情况下，语音的情感相关性的表示形式可以通过说话人模型或者声学模型来实现。已有的研究成果表明，针对情感识别所采用的特征大多是韵律特征，也就是超音段特征，如基音、强度、持续时间、以及它们的衍生参数。然而，语音音质听觉方面的信息也是常常需要考虑的因素。

非专利文献Alter，E.Tank，andS.Kotz，″AccentuationandEmotions-twodifferentsystems，″presentedatISCAWorkshop(ITRW)onSpeechandEmotion，Newcastle，NorthernIreland，2000，Alter等人通过对韵律和音质之间关系的研究，发现生气和高兴时的发音在喘气和沙哑等方面是不同的。其他的研究表明，语音信号的韵律特征与三个情感维度(效价维、激活维和控制维)之间的具有一定关联性，其中激活维和韵律特征之间具有明显关联，激活维相近的情感状态具有相似的韵律特征且易混淆。

发明内容

发明的目的就在于解决现有技术的缺陷，设计、研究一种高性能的识别语音情感的装置和方法。

本发明的技术方案是：一种识别语音情感的装置，包括，训练部，用于对预处理语音数据进行语音特征提取，通过特征提取和高斯建模，对高斯建模得到的结果进行SVM分类；

识别部，用于识别语音的情感状态，对待识别语音进行语音特征提取，通过特征选择，进行高斯似然度计算，对计算结果与SVM分类进行对比，得到待识别语音的情感类别。

进一步的，所述训练部包括，训练语音数据库，用于训练情感识别方法的语音数据，包括多种情感类型的语音数据；

语音特征提取模块，用于提取训练语音数据库中每一条语音数据的基本声学特征，基本声学特征包括基音及其一阶、二阶差分的统计特征，共振峰及其统计特征，以及MFCC特征及其统计特征；

特征选择模块，对任意两种情感类型进行组合，选择其声学特征，得到训练数据；

高斯建模模块，对训练数据采用高斯混合模型建模，得到数据分布；

SVM分类器，对训练语音数据库中的每一条语音数据，在任意两种情感类型的组合模式下，根据高斯模型得到该语音数据属于这两个情感类型的似然度。

进一步的，所述识别部包括，特征提取模块，用于提取待识别语音的基本声学特征；

选择模块，用于对待识别语音的任一两种情感类型进行组合，选择其声学特征，得到待识别数据；

高斯似然度计算模块，对待识别数据进行似然度计算；