[发明专利]基于知识驱动多分类的情绪原因对提取方法及系统在审
| 申请号: | 202210805075.1 | 申请日: | 2022-07-10 |
| 公开(公告)号: | CN115129818A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 宗林林;张靖琳;秦鑫;张宪超;徐博 | 申请(专利权)人: | 大连理工大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/242;G06F40/279;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 大连星河彩舟专利代理事务所(普通合伙) 21263 | 代理人: | 陈玲玉 |
| 地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 驱动 分类 情绪 原因 提取 方法 系统 | ||
本发明公开了基于知识驱动多分类的情绪原因对提取方法及系统,本发明将数据集文档分词后,计算从句中每个词的情绪分数,相加得到从句的情绪分数。再通过长短期记忆人工神经网络学习文档上下文信息,结合位置嵌入学习和窗口搜索提取情绪‑原因对。本发明联合语义知识嵌入,位置信息学习和窗口搜索提高情绪‑原因对提取的准确率。缓解了标签不平衡等问题,在公开的数据集上有较好的效果。
技术领域
本发明属于自然语言处理领域,涉及一种基于知识驱动多分类和图位置嵌入的情绪-原因对提取。
背景技术
近年来,情绪分析成为自然语言处理的热门方向。情绪原因提取(ECE)是情绪分析的一个分支,给定一个文档和其中的情绪从句,找出引起情绪的原因从句。尽管情绪原因提取在自然语言处理任务中引起了广泛关注,但它要求情绪从句必须事先标记,在实际场景应用中难以展开。为了解决这一问题,提出了一项新任务,称为情绪原因对提取(ECPE)。与之前情绪原因提取从句的任务不同,情绪原因对提取任务将情绪从句及其对应的原因从句视为一个整体,称为情绪原因对,联合提取二者。提取的情绪-原因对包含了丰富的情绪原因信息,在深入的情绪分析中起着关键作用。这项任务在最近的研究中引起了广泛关注。
图1是ECPE任务的一个文档和提取的情绪原因对,文档中包含五个连续子句。C1是一个情绪从句,带有情绪词“Excited”,同时C1也是自己对应的原因从句。其中情绪“Excited”是由短语“See the paintings”引起的。同样,C4也是情绪从句带有情绪词“Guilty”,但引起“Guilty”情绪的原因并不包含在C4中。阅读文档中的其他从句可以发现,C5是与C4相对应的原因从句。此任务的目标是提取情绪原因对集合:[(C1,C1),(C4,C5)]。
与给定情绪的原因提取任务相比,情绪-原因对提取是一项更具有挑战性的任务。以往对情绪-原因对提取的研究主要分为两类:管道模型和端到端模型。管道模型由两部分组成:第一步设计算法分别提取情绪子句和原因子句,第二步将第一步提取的情绪子句和原因子句进行匹配。然而管道模型具有严重的缺陷,由于第一步产生的错误可能会传播并影响第二步的性能,因此管道模型的性能受到限制。为了解决这个问题,端到端的情绪原因对算法被提出,大多数现有的端到端模型使用二维表示来表示情绪-原因对,并基于不同的神经模型对其进行预测。
虽然这些研究提高了情绪-原因对提取的性能,但仍然存在以下三个问题。(1)大多数相关研究将从句分为两种类型:情绪和原因,忽略了事实上有四种类型的从句:情绪,原因,既是情绪也是原因和既不是情绪也不是原因。用于检测情绪和原因的传统二元分类可能会被其他两种类型误导。(2)情绪从句和原因从句通常由一些特定的词决定,这些词使从句成为情绪从句或原因从句。这些独特的词通常具有事先已知的特定属性,然而最近的工作中并不包含这些先验知识,事实上人类在情绪原因的判断中也会受到先验知识的影响。(3)现有的工作中通常根据真实情绪-原因对相对位置进行编码或生成位置矩阵,这可能会受到不精确情绪假设子句和文档长度不平衡的负面影响。
发明内容
本发明的目的是提供一种情绪原因识别算法,克服现有的情绪原因模型中从句类型区分不全的缺点。本发明将情绪原因对提取作为一种新的基于知识的多分类任务,并提出了一种基于图的位置嵌入约束。本发明将从句分为四种类型:情绪从句、原因从句、情绪原因从句和非情绪原因从句。首先,设计了一个子任务来提取这四种类型的从句,该子任务利用了语义嵌入和先验情绪信息。然后,针对训练数据集情绪原因对位置构造加权有向图,并传播边权重信息以获得边的上下文信息。随后,综合入度、出度和边上下文信息,得到位置嵌入。最后,设计基于窗口大小的情绪原因对提取模型。
本发明的技术方案为:
基于知识驱动多分类和图位置嵌入的情绪原因对提取方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210805075.1/2.html,转载请声明来源钻瓜专利网。





