[发明专利]一种情感倾向预测方法、装置、系统及存储介质在审
| 申请号: | 201910941635.4 | 申请日: | 2019-09-30 |
| 公开(公告)号: | CN110674301A | 公开(公告)日: | 2020-01-10 |
| 发明(设计)人: | 祝文博;雷欣;李志飞 | 申请(专利权)人: | 出门问问信息科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06N3/04 |
| 代理公司: | 11734 北京乐知新创知识产权代理事务所(普通合伙) | 代理人: | 江宇 |
| 地址: | 100044 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情感倾向 神经网络 图形结构 文本信息 相似度 预测 邻接矩阵 计算机存储介质 情感分类模型 语义 数据转化 预测结果 长文本 转化 聚合 | ||
本发明公开了一种基于图神经网络(GNN)的情感倾向预测方法、装置、系统及计算机存储介质。基于图神经网络的情感倾向预测方法包括:首先,获取一段文本信息;然后,将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;接下来,将该图形结构数据转化为由词之间相似度构成的邻接矩阵;随后通过情感分类模型对邻接矩阵进行情感倾向预测。这种情感倾向预测方法在处理长文本时,通过词和词之间地相似度,将文本信息转化为图形结构数据,一方面能够利用图神经网络的优势包含尽可能多的语义;另一方面通过将相近的词聚合在一起,也更易于提取到最有代表意义的情感倾向特征,使预测结果更为准确。
技术领域
本发明涉及人工智能(Artificial Intelligence,AI)技术领域,尤其涉及一种基于图神经网络GNN的情感倾向预测方法、装置、系统及计算机存储介质。
背景技术
情感分类是自然语言处理中一种常见的任务。具体来说,就是给出一段文本信息,使用情感分类模型预测该文本信息的情感倾向。
目前,情感倾向预测方法大多基于词向量序列和卷积神经网络实现的。这种情感倾向预测方法,在前期对文本信息中的句子进行转化时,主要使用如下方法:首先,对句子进行分词,将提取到的词语转化为词向量;然后,将词向量按照词在句子中的位置顺序排列,构成句子矩阵。同理,将句子矩阵按照句子在文本中的位置顺序排列,构成文本矩阵。由此可见,这一过程类似于编码的过程,并没有太多提炼或精简的过程。而且,在这样得到的文本矩阵中,词的排列顺序和组合方式仅与语序相关而与语义无关。
使用这种情感倾向预测方法对长文本信息进行处理时就会变得比较困难。因为当文本信息很长时,基于词向量序列的文本矩阵就会是个非常大的矩阵,且与情感倾向相关的词也会分散在文本矩阵的各个位置。这就会导致以下问题:1)当句子矩阵的大小超出神经网络能够处理的矩阵大小时,只能舍弃部分词向量,截取部分矩阵进行处理。这等同于,在进行情感倾向预测时,只用到了一句话的前段、中断或后段,此时发生语义缺失的可能性极大;2)即使句子矩阵的大小未超出神经网络能够处理的矩阵大小,由于情感倾向相关的词可能会分散在矩阵的各个位置,单个卷积窗口的大小所能覆盖的范围也会限制情感倾向特征提炼的准确性。
发明内容
众所周知,图神经网络GNN的一个基本思想是基于节点的局部邻节点信息对节点进行向量转化(embedding),就是通过神经网络来聚合每个节点及其周围节点的信息。因此图神经网络具有以下特点:1)节点在每一层都会有向量转化;2)模型可以达到任意深度;3)第零层节点的向量转化是其自身的输入特征向量。
于是,本发明人就创造性地想到是否可以利用图神经网络的以上优势将长文本转化为以词为节点,以词之间相似性为边的一种图形结构,利用图神经网络模型进行情感倾向预测,这样不但可以去除重复的词,使文本矩阵得到精简包含更多不同的词,还能够使词按照语义聚合,更易于准确地提取相关情感倾向特征。
基于以上发明思路,本发明实施例提供了一种基于图神经网络的情感倾向预测方法、装置、系统及计算机存储介质。
根据本发明实施例第一方面,提供一种基于图神经网络的情感倾向预测方法,该方法包括:获取文本信息;将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;将图形结构数据转化为由词之间相似度构成的邻接矩阵;通过情感分类模型对邻接矩阵进行情感倾向预测。
根据本发明一实施方式,将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据,包括:提取文本信息中的词;获取所提取的词之间的相似度;以所提取的词为节点,以词之间的相似度作为边构造图形结构数据。
根据本发明一实施方式,获取所提取的词之间的相似度,包括:通过词向量转化工具获取所提取的词之间的相似度。
根据本发明一实施方式,获取所提取的词之间的相似度,包括:通过使用词相似度计算方法进行建模获取所提取的词之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910941635.4/2.html,转载请声明来源钻瓜专利网。





