[发明专利]语音情感识别方法和装置、服务器、计算机可读存储介质在审

申请号：	201911300620.6	申请日：	2019-12-17
公开（公告）号：	CN111145786A	公开（公告）日：	2020-05-12
发明（设计）人：	刘峰;涂臻;刘广志;刘云峰	申请（专利权）人：	深圳追一科技有限公司
主分类号：	G10L25/63	分类号：	G10L25/63;G10L25/03;G10L25/24;G10L25/30;G10L25/78;G10L15/26;G06N3/04;G06N3/08
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	方高明
地址：	518051 广东省深圳市南山区粤海街道***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音情感识别方法装置服务器计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种语音情感识别方法和装置、服务器、计算机可读存储介质，包括：从原始音频帧序列中获取有效音频片段。对有效音频片段提取音频特征及文本特征，将有效音频片段的音频特征及文本特征，输入至预设语音情感识别模型中进行语音情感识别，得到原始音频帧序列的情感分类。不仅从原始音频帧序列中的有效音频片段中提取出文本特征，还提取出音频特征。然后，将所提取出的文本特征和音频特征同时一起输入至预设语音情感识别模型中进行处理，最终得到原始音频帧序列的情感分类。显然，对原始音频帧序列中的有效音频片段同时从文本特征和音频特征两个维度进行识别出情感分类，大大提高了所得到的情感分类的准确性。

技术领域

本申请涉及计算机技术领域，特别是涉及一种语音情感识别方法和装置、服务器、计算机可读存储介质。

背景技术

随着语音识别技术的发展，识别准确率不断提高，语音识别技术也被应用到越来越多的场景。通过语音不仅可以传递语义信息，还可以传递情感信息。因此，语音情感识别也是语音识别的一个重要组成部分，对语音的情感进行识别，有利于更全面地捕捉到语音的全部信息。但是，传统的语音情感识别技术对情感的识别准确率较低，因此，亟待解决传统的语速情感识别准确率较低的问题。

发明内容

本申请实施例提供一种语音情感识别方法、装置、服务器、计算机可读存储介质，可以提高语音情感识别的准确性。

一种语音情感识别方法，包括：

从原始音频帧序列中获取有效音频片段；

对所述有效音频片段提取音频特征及文本特征；

将所述有效音频片段的音频特征及文本特征，输入至预设语音情感识别模型中进行语音情感识别，得到所述原始音频帧序列的情感分类。

在其中一个实施例中，所述从原始音频帧序列中获取有效音频片段，包括：

对原始音频帧序列进行语音端点检测，将所述原始音频帧序列分割为有效音频片段和无效音频片段；

从所述原始音频帧序列分割后的有效音频片段和无效音频片段中，获取有效音频片段。

在其中一个实施例中，所述对所述有效音频片段提取音频特征及文本特征，包括：

将所述有效音频片段按照预设规则划分为多个音频单元；

对所述有效音频片段中的每个音频单元提取音频特征；