[发明专利]一种融入描述知识的基于目标的情感分类方法有效
申请号: | 201811551884.4 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109726745B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 宋丹丹;邢博文;廖乐健 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 毛燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种融入描述知识的基于目标的情感分类方法,属于深度学习及知识库技术领域。在基于目标的情感分析任务中,本发明利用目标的描述知识并将描述信息融入到目标表示中,目标的描述来自含有关于实体的海量知识且易访问的知识库。针对基于目标的情感分析,本发明提出了一种新的模型‑DEGN,该模型利用一个门控机制紧密有效地将所给目标的描述知识结合到端到端的神经网络中,并且利用监督注意力机制从目标、目标上下文以及目标的描述句中抽取重要信息来生成它们更有效的表示。本发明在F1‑score和strict accuracy两个指标上均超过所有已有模型,达到最高水平。 | ||
搜索关键词: | 一种 融入 描述 知识 基于 目标 情感 分类 方法 | ||
【主权项】:
1.一种融入描述知识的基于目标的情感分类方法,其特征在于包括以下步骤:步骤1、将数据集分为训练集和测试集,所述训练集用于优化模型参数,所述测试集用于测试模型效果;按批次输入训练数据,输入数据样本为目标、情感句以及正确的目标情感极性标签;步骤2、从在线知识库中,抽取数据集中目标词或短语文本形式的描述信息;步骤3、进行数据预处理,将文本形式的数据转化为含有语义信息的向量;步骤4、采用长短期记忆网络,分别对目标、目标的描述以及目标上下文进行建模,并利用注意力机制生成三者的向量表示;步骤5、采用门控机制,将向量形式的描述信息融入目标的向量表示中,得到新的目标的向量表示,具体方法如下:步骤5.1、利用一个描述嵌入门控机制,控制向目标的表示向量中融入描述向量的程度,方式如下:通过描述和目标的向量表示,计算得到一个标量g控制融入描述知识的程度,计算公式为:g=Wg*[trep,drep]其中,[,]表示向量拼接运算,Wg是权重矩阵,Wg将目标的表示向量和描述向量拼接而成的向量映射到实数空间,得到g为实数,g能够控制描述融入到目标中的程度,并且g对于不同的目标‑描述对都是不同的;步骤5.2、在g的控制下,将描述知识的向量表示融入目标的向量表示中,生成新的目标向量表示,计算公式为:trep=trep+g*drep得到的trep为更新后的目标向量表示;步骤6、将新的目标向量与目标上下文向量进行拼接并送入分类器,最终输出情感分类结果;步骤7、根据定义好的损失函数计算损失,更新参数;训练数据处理完毕后输入测试数据用来测试模型效果,若模型效果指标不再提高或达到要求,停止迭代,保存模型结果;用该模型对基于目标的情感分类数据进行预测,输出情感分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811551884.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种网络流量分类方法
- 下一篇:一种模板匹配的方法及装置