[发明专利]基于语义细胞的语音情感识别方法有效
申请号: | 201410402937.1 | 申请日: | 2014-08-15 |
公开(公告)号: | CN104200814B | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 孙凌云;何博伟;汤永川;李彦;郑楷洪 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/06 |
代理公司: | 杭州天勤知识产权代理有限公司33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 细胞 语音 情感 识别 方法 | ||
技术领域
本发明涉及语音识别技术领域,具体涉及一种基于语义细胞的语音情感识别方法。
背景技术
语音是用来表示语言的声音符号,是人类相互交流、传递情感的重要媒介之一。语音情感识别是情感计算领域的重要研究方向,其目标是通过语音信号识别说话者的情感状态,最终实现自然、友好、生动的人机交互。
语音情感识别技术可用于交互式教学、智能车载系统、智能家电等诸多领域,如Schuller等研发的在线电影和计算机教程应用程序中,系统根据检测到的情感信息对用户做出响应(Schuller B,Rigoll G,Lang M.Speech emotion recognition combining acoustic features and linguistic information in a hybrid support vector machine-belief network architecture.//Acoustics,Speech,and Signal Processing,2004.Proceedings.(ICASSP'04).IEEE International Conference on.IEEE.Montreal,Canada,2004:1:I-577-80vol.1.);Jones等将语音情感识别技术用于车载系统,合成与驾驶人情感匹配的提示语音以增强驾驶体验(见:Jones C M,Jonsson M.Performance analysis of acoustic emotion recognition for in-car conversational interfaces//Universal Access in Human-Computer Interaction.Ambient Interaction.Springer.Heidelberg,Berlin,2007:411-420.)。
使用语音特征数据训练分类器是目前语音情感识别系统的主要做法,如基于支持向量机(SVM)、人工神经网络(ANN)、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、k-近邻(k-NN)、AdaBoost等。每种分类器都有其优缺点,如GMM分类器训练时间少,但对模型初始化参数敏感;SVM分类器需要相对较长时间的训练,但对模型初始值不敏感。
此外,由于传统k-NN算法需要存储所有的特征数据,GMM算法需要存储各维度各高斯分量的参数,SVM算法需要存储用于分割超平面的支持向量,直接导致识别模型需要的存储空间大。
发明内容
本发明利用语义细胞认知结构上的优势,克服现有语音情感识别算法生成模型占用数据空间大的不足,且能保持与SVM算法相似的识别精准度。
一种基于语义细胞的语音情感识别方法,包括:
(1)构建语音库,所述语音库中包括若干个语音参照人的若干条不同情感的语音信号;
(2)针对语音库中任意一条语音信号,进行预处理将当前语音信号划分为若干帧,并对每一帧进行情感特征提取,根据提取结果计算当前语音信号的特征向量;
(3)根据所述的特征向量,利用基于语义细胞的混合模型训练得到分类器的识别模型;
(4)利用所述的识别模型识别待识别语音信号所属的情感类别。
语义细胞(Information Cell)理论由汤永川和Lawry J.共同提出(Tang Y,Lawry J.Information Cell Mixture Models:The Cognitive Representations of Vague Concepts//Integrated Uncertainty Management and Applications.Heidelberg,Berlin:Springer,2010:371-382.),其基础是模糊计算和原型理论,主要思想是:概念并不由形式规则或映射来表示,而是由其原型来表示,概念范畴基于同原型的相似性来判定。语义细胞具有透明的认知结构,符合人类学习概念的认知过程,具有坚实的认知心理学基础与严格的数学定义,具备描述模糊概念的先天优势。语音情感识别是模糊概念领域中的典型问题,语音中的情感分类(如愤怒、惊奇等)是一种模糊概念,难以凭借具体规则进行界定。而通过原型表达概念的语义细胞因为其不依赖具体分类规则的特点,适合于语音情感识别。因此,基于语义细胞的混合模型训练得到的分类器能够有效的提高分类器的识别率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410402937.1/2.html,转载请声明来源钻瓜专利网。