首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于并联张量分解卷积神经网络的语音情感识别方法在审

申请号：	202210069622.4	申请日：	2022-01-21
公开（公告）号：	CN114420151A	公开（公告）日：	2022-04-29
发明（设计）人：	郭敏;林雪;马苗;李志强	申请（专利权）人：	陕西师范大学
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/24;G10L25/30;G10L25/63;G06N3/08
代理公司：	西安永生专利代理有限责任公司 61201	代理人：	申忠才
地址：	710062 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于并联张量分解卷积神经网络语音情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于并联张量分解卷积神经网络的语音情感识别方法，其特征在于它是由下述步骤组成：

(1)数据集预处理

取柏林语音数据集语音535个，共分布在高兴、生气、悲伤、害怕、中性、无聊、厌恶七种不同情感类别中；

1)将柏林语音数据集按照4：1的比例分成训练集、测试集；

2)将训练集切成大小为50000个样本，每个样本为3.12秒的等尺寸语音片段，并将等尺寸语音片段归一化到[0,1]；

(2)提取特征

采用时频转换的方法从等尺寸语音片段中提取梅尔频谱图特征和调制谱图特征；

(3)构建并联张量分解卷积神经网络

并联张量分解卷积神经网络由第一张量分解卷积神经网络、第二张量分解卷积神经网络并联经三维张量分解卷积神经网络与全连接层相连构成；

(4)训练并联张量分解卷积神经网络

1)确定目标函数

目标函数包括损失函数L和评价函数F1，按下式确定损失函数L：

其中，X表示真实值，X∈{x₁,x₂,...x_m}，Y表示预测值，Y∈{y₁,y₂,...y_m}，m是元素的个数、m∈{1,2,...,535}；

按下式确定的评价函数F1：

其中，P是准确率，P∈[0,1],R是召回率，R∈[0,1]，T是真阳性，T∈[0,1]，F是假阳性，F∈[0,1],Q是假阴性，Q∈[0,1]，且P、R、T、F、Q不同时为0；

2)训练并联张量分解卷积神经网络

将训练集送入到并联张量分解卷积神经网络中进行训练，在训练的过程中，并联张量分解卷积神经网络学习率r∈[10^-5,10^-3]，优化器采用Adam优化器，迭代至损失函数L收敛；

(5)测试并联张量分解卷积神经网络

将测试集输入到并联张量分解卷积神经网络中进行测试；

(6)识别和分类语音情感

将提取到的语音特征输入并联张量分解卷积神经网络中，使用常规softmax激活函数进行回归得到不同情感的概率值如下：

高兴概率w_h、生气概率w_a、悲伤概率w_sa、害怕概率w_f、中性概率w_n、无聊概率w_su、厌恶概率w_d；

设置不同的情感权值：高兴权值p_h、生气权值p_a、悲伤权值p_sa、害怕权值p_f、中性权值p_n、无聊权值p_su、厌恶权值p_d，按下式对语音进行情感识别分类，得到高兴、生气、悲伤、害怕、中性、无聊、厌恶七种不同的语音情感：

E＝Max(w_h×p_h,w_a×p_a,w_sa×p_sa,w_f×p_f,w_n×p_n,w_su×p_su,w_d×p_d)

其中Max()表示取最大值，w_h×p_h,w_a×p_a,w_sa×p_sa,w_f×p_f,w_n×p_n,w_su×p_su,w_d×p_d分别表示加权后的高兴概率、生气概率、悲伤概率、害怕概率、中性概率、无聊概率、厌恶概率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于陕西师范大学，未经陕西师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210069622.4/1.html，转载请声明来源钻瓜专利网。

上一篇：基于骨科的辅助螺钉连接棒微创置入用手术工具
下一篇：一种微量镍复合层状镁复合材料及其制备方法和应用

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top