[发明专利]一种基于图神经网络的电影评论情感分类方法及装置在审

专利信息
申请号: 202210060250.9 申请日: 2022-01-19
公开(公告)号: CN114528374A 公开(公告)日: 2022-05-24
发明(设计)人: 杨旭华;陶进;张宇辰;徐新黎 申请(专利权)人: 浙江工业大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F40/211;G06F40/289;G06K9/62;G06N3/04;G06N3/08
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 忻明年
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 神经网络 电影 评论 情感 分类 方法 装置
【说明书】:

发明公开了一种基于图神经网络的电影评论情感分类方法及装置,基于文本句子自身特有的语法信息和文本单词的窗口共现关系,将其构建成图数据结构,分别获取文本共现图和句法依存图的邻接矩阵,进一步将单词嵌入向量矩阵和邻接矩阵输入到图卷积网络模块得到加权加权特征矩阵,采用混合池化模块对文本共现图的加权特征矩阵和句法依存图的加权特征矩阵进行池化操作,得到文本共现图的特征向量和句法依存图的特征向量,对特征向量进行融合后输入到分类器得到分类结果。本发明使得学习得到的网络表示不仅仅包含邻近单词的信息,也包含因为语法关系相关的比较远的单词的信息,从而提高情感分类的准确性。

技术领域

本申请属于自然语言处理技术领域,尤其涉及一种基于图神经网络的电影评论情感分类方法及装置。

背景技术

当前是一个互联网和大数据的时代,每天都有各种形式的海量数据产生,比如文本、语音、视频等等,文本数据在其中占了很大的一部分。随着文化产业的快速发展,每年上映的电影数量在不断攀升,随之带来的是各种各样的电影评论,比如在豆瓣、猫眼等知名电影网站包含大量的电影评论,如何从这些电影评论挖掘出有用的信息,就成为一个关键问题,其中重要的一步就是对这些电影评论进行情感分类。

情感分类是自然语言处理中一个基本且重要的任务。早期情感分类主要用的是传统的机器学习方法,先进行特征工程,最后通过分类器方法对特征向量进行分类,比如支持向量机模型、k最近邻方法、朴素贝叶斯等等。但是这样的方法过分依赖于人工手动进行特征提取,效率比较低下。随着深度学习研究的进展,word2vec和Glove词向量模型的提出,深度学习开始应用于自然语言处理领域,这省去了手动提取文本特征的繁琐的步骤,并且将卷积神经网络和循环神经网络应用于情感分类任务上,进而研究者提出了TextCNN,CharCNN等模型,取得了很好的结果。但是,无论是卷积神经网络还是循环神经网络都只是聚焦于文本的序列模型,忽略了情感文本之间的结构性,而图卷积神经网络GCN正好能够在学习文本嵌入的过程保留结构信息,从而进一步提升电影评论的情感分类效果。

发明内容

本申请的目的是提供一种基于图神经网络的电影评论情感分类方法及装置,用以克服现有情感分类方法忽略文本语法特性以及文本的拓扑结构,丰富文本的嵌入信息,进一步优化文本中情感的嵌入表示,提升电影评论分类准确度。

为了实现上述目的,本申请技术方案如下:

一种基于图神经网络的电影评论情感分类方法,所述基于图神经网络的电影评论情感分类方法,包括:

收集电影评论文本数据集,对每个电影评论文本进行预处理,得到文本词汇表,将文本词汇表中的单词用嵌入向量表示,得到电影评论文本的单词嵌入向量矩阵;

将文本词汇表中的单词作为节点,单词之间的共现关系作为连边构建文本共现图,得到文本共现图的邻接矩阵;

将文本词汇表中的单词作为节点,句法关系作为连边构建成文本的句法依存图,得到句法依存图的邻接矩阵;

将单词嵌入向量矩阵和文本共现图的邻接矩阵输入到文本共现图卷积网络模块,得到文本共现图的加权特征矩阵;

将单词嵌入向量矩阵和句法依存图的邻接矩阵输入到句法依存图卷积网络模块,得到句法依存图的加权特征矩阵;

采用混合池化模块对文本共现图的加权特征矩阵和句法依存图的加权特征矩阵进行池化操作,得到文本共现图的特征向量和句法依存图的特征向量;

采用自适应特征融合模块对文本共现图的特征向量和句法依存图的特征向量进行自适应融合;

将自适应融合后的融合特征输入到文本分类器模块,预测出电影评论文本的情感分类结果。

进一步的,所述将单词嵌入向量矩阵和文本共现图的邻接矩阵输入到文本共现图卷积网络模块,得到文本共现图的加权特征矩阵,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210060250.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top