[发明专利]一种结合外部知识的文本隐式情感分析方法有效
申请号: | 202110811087.0 | 申请日: | 2021-07-19 |
公开(公告)号: | CN113435211B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 史树敏;邬成浩;黄河燕 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06F16/36;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 外部 知识 文本 情感 分析 方法 | ||
本发明涉及一种结合外部知识的文本隐式情感分析方法,属于自然语言处理情感分析技术领域。本方法利用TransE模型对常识知识数据集预训练。对常识知识数据集中的每个知识子图,通过注意力机制计算每个知识子图的向量表示。对于需要进行隐式情感分析的句子采用预训练的单词特征向量表示文本序列中的每个单词的向量化表示,并与知识图特征向量表示进行拼接,得到结合外部知识的单词融合特征表示。使用双向长短时记忆网络对融合外部知识的单词表示进行句子层面的文本编码。通过注意力机制决定每个词语在表示学习过程中的重要性。最后将句子表示通过Softmax层计算对应的概率向量。本方法丰富了句子语义表达,更好建模句子表示,提升了文本隐式情感分析性能。
技术领域
本发明涉及一种结合外部知识的隐式情感分析方法,具体涉及一种利用外部常识知识库中抽取到的信息有效识别文本中的隐式情感的方法,属于自然语言处理情感分析技术领域。
背景技术
近年来,随着互联网及社交网络的发展,文本情感分析已成为自然语言处理领域最热门的研究方向之一。全面、精确地理解文本所表达的情感,能够应用于股市预测、客户反馈跟踪、意见挖掘等众多场景,产生广泛的社会效益。
文本情感分析,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。从文本的语言表达层面,可划分为显式情感分析和隐式情感分析。其中,隐式情感分析被定义为“不含有显式情感词,但表达了主观情感的语言片段(句子,从句或短语)”。
目前,显式情感分析作为该领域的基础性研究内容,已经取得了许多丰硕的成果,而隐式情感分析研究仍处于起步阶段。在日常表达中,人们在对客观事物体验及其行为所反映出的情感是丰富而抽象的,除采用显式情感词表达情感外,还采用客观陈述或修辞方式来隐式地表达自己的情感。通过对隐式情感分析的研究,能够更全面、更精确得提升文本情感分析的性能,可以为文本表示学习、自然语言理解、用户建模、知识嵌入等方面研究起到积极的推动作用,也可进一步促进基于文本情感分析相关领域的应用和产业的快速发展。
目前,现有的隐式情感分析方法,主要是围绕文本语义信息、句法信息及上下文信息编码上,通过融合多层次的信息进行隐式情感的识别。然而,由于隐式情感文本本身所提供的信息不足,仅对隐式情感文本建模,无法有效捕获隐藏的情感特征。
发明内容
本发明的目的是针对现有技术没有充分弥补隐式情感文本有效信息不足的缺陷,为解决有效捕获文本隐藏的情感特征的技术问题,提出了一种结合外部知识的文本隐式情感分析方法。
首先,对有关概念进行说明:
定义1:知识图谱G
指由实体(节点)和关系(不同类型的边)组成的多关系图。
知识图谱G由多个子图构成,其表达式为:代表一系列知识子图的集合。
定义2:文本序列s
其表达式为:{s=w1,w2,...,wN},表示需要进行情感分析的句子,该句子中有N个单词w1,w2,...,wN,下标N为句子单词序列长度,w代表单词。
定义3:输入文本序列的单词特征向量
指将输入文本序列向量化所使用的预训练向量,包括语义向量和位置向量。其中,语义向量指当前单词的语义特征信息,位置向量指当前单词在文本序列的位置特征信息。
定义4:注意力
指为了合理利用有限的视觉信息处理资源,人类需要选择视觉区域中的特定部分,然后集中关注它的现象。
人工智能利用这一现象,提出使得神经网络具备选择特定的输入的能力。本方法中,注意力体现在:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110811087.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源电力工程配电箱
- 下一篇:包装袋高效开口系统