[发明专利]基于CNN-RSC组合优化算法的语音情感分析方法在审

专利信息
申请号: 201810576206.7 申请日: 2018-06-06
公开(公告)号: CN108763219A 公开(公告)日: 2018-11-06
发明(设计)人: 吴立刚;赵永生;赵峰;徐海青;陈是同;徐唯耀;秦浩;王文清;郑娟;秦婷;梁翀;浦正国;王维佳;张天奇;余江斌;韩涛;杨维;张才俊;孙林檀;田诺;潘子春;李葵;李明;张引强;黄影 申请(专利权)人: 安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 合肥维可专利代理事务所(普通合伙) 34135 代理人: 吴明华
地址: 230088 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 组合优化算法 词向量 向量 情感分类 输入样本 向量矩阵 语音情感 自动学习 特征词 词语 卷积神经网络 准确度 分词处理 分类结果 局部特征 特征输入 特征向量 文本情感 误差分析 向量编码 优化处理 能力强 输出层 新特征 训练集 自编码 池化 递归 卷积 语料 捕获 过滤 分析 输出 分类
【说明书】:

发明公开了一种基于CNN‑RSC组合优化算法的语音情感分析方法,属于情感技术领域,具体步骤包括:对训练集的语料进行分词处理得到词语;对词语进行向量编码;生成词向量;将生成的词向量作为输入样本,输入到卷积神经网络模型中;卷积层过滤输入样本的词向量中多个词之间的局部特征,生成新的特征向量;池化层捕获新特征向量最大值,得到特征词向量矩阵;特征词向量矩阵作为递归自编码中的特征输入,得到最佳向量;最佳向量加入到输出层进行分类,输出情感分类结果;对情感分类结果进行误差分析和优化处理。本发明提出的组合优化算法在对文本情感特征的自动学习上有着不错的效果,模型的训练速度也大大的提高,分类结果准确度高、自动学习能力强。

技术领域

本发明属于情感技术领域,特别涉及一种基于CNN-RSC组合优化算法的语音情感分析方法。

背景技术

全球智能语音产业总体情况随着智能语音应用需求的不断扩大,以大数据、云计算、移动互联网等关键技术为支撑的智能语音产业迅速发展。基于深度学习技术的情感分析也逐渐成为研究的热点之一。情感分析过程是对文本中具有情感色彩的词语进行相应的分析、处理、分类归纳和推理的过程。但是在当前的情感分析过程中,由于格式不规范、随意性高、对象不明确、噪声影响程度高还有大量网络用语等特点而加大了研究的难度。

目前,国内外有很多针对文本进行情感分析方面的研究。研究者利用传统的机器学习算法,如支持向量机、条件随机场、信息熵等对文本进行情感分析。但是上述方法往往忽略了文本的语义结构信息,最终的结果难免差强人意。而深度学习中的递归自编码模型,将文本中的语音信息融入在最佳树结构中,在特征信息提取、情感分析中具有优异的表现。递归自编码算法(RSC)是一种深度学习模型,利用此算法模型在进行情感分析时,可以复现语句中的语句结构、词序等重要信息,从而可大大提高分析的准确度,更深层地提取语音信号中的关键信息,递归自编码算法对特征的自动学习能力差。基于卷积神经网络(CNN)模型能够有效地抽取输入样本中有意义的特征表示,在单一的卷积神经网络的卷积层和池化层后加上全连接层作为分类层,便可以得到输入样本的类别标签,但是全连接的分类层对于非线性可分数据的分类能力较弱。因此,能够准确且有效对语音情感分析的方法是目前亟待解决的问题。

发明内容

本发明所要解决的技术问题是提供一种基于CNN-RSC组合优化算法的语音情感分析方法,本发明提出的组合优化算法在对文本情感特征的自动学习上有着不错的效果,模型的训练速度也大大的提高,分类结果准确度高、自动学习能力强。

本发明为解决现存问题提供了以下技术方案:

为实现上述目的,一方面本发明提供了一种基于CNN-RSC组合优化算法的语音情感分析方法,所述方法具体步骤为:

S1:对训练集的语料进行分词处理得到词语;

S2:对词语进行向量编码;

S3:用矩阵将一段语句表示出来生成词向量;

S4:将生成的词向量作为输入样本,输入到卷积神经网络模型中的输入层;

S5:卷积神经网络模型中的卷积层过滤输入样本的词向量中多个词之间的局部特征,生成新的特征向量;

S6:卷积神经网络模型中的池化层捕获新特征向量最大值,得到特征词向量矩阵;

S7:特征词向量矩阵作为递归自编码中的特征输入,通过计算相邻词语间的重构误差生成最佳树结构,得到最佳向量;

S8:最佳向量加入到卷积神经网络模型的输出层进行分类,输出情感分类结果;

S9:对情感分类结果进行误差分析和优化处理。

进一步优选的,所述分词处理利用中科院分词软件。

进一步优选的,所述输入样本的词向量通过随机赋值生成或大量的无标注语料进行预先训练好。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司,未经安徽继远软件有限公司;国网信息通信产业集团有限公司;国网安徽省电力有限公司信息通信分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810576206.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top