[发明专利]基于知识驱动多分类的情绪原因对提取方法及系统在审

专利信息
申请号: 202210805075.1 申请日: 2022-07-10
公开(公告)号: CN115129818A 公开(公告)日: 2022-09-30
发明(设计)人: 宗林林;张靖琳;秦鑫;张宪超;徐博 申请(专利权)人: 大连理工大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F40/242;G06F40/279;G06F40/30;G06N3/04;G06N3/08
代理公司: 大连星河彩舟专利代理事务所(普通合伙) 21263 代理人: 陈玲玉
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 知识 驱动 分类 情绪 原因 提取 方法 系统
【说明书】:

发明公开了基于知识驱动多分类的情绪原因对提取方法及系统,本发明将数据集文档分词后,计算从句中每个词的情绪分数,相加得到从句的情绪分数。再通过长短期记忆人工神经网络学习文档上下文信息,结合位置嵌入学习和窗口搜索提取情绪‑原因对。本发明联合语义知识嵌入,位置信息学习和窗口搜索提高情绪‑原因对提取的准确率。缓解了标签不平衡等问题,在公开的数据集上有较好的效果。

技术领域

本发明属于自然语言处理领域,涉及一种基于知识驱动多分类和图位置嵌入的情绪-原因对提取。

背景技术

近年来,情绪分析成为自然语言处理的热门方向。情绪原因提取(ECE)是情绪分析的一个分支,给定一个文档和其中的情绪从句,找出引起情绪的原因从句。尽管情绪原因提取在自然语言处理任务中引起了广泛关注,但它要求情绪从句必须事先标记,在实际场景应用中难以展开。为了解决这一问题,提出了一项新任务,称为情绪原因对提取(ECPE)。与之前情绪原因提取从句的任务不同,情绪原因对提取任务将情绪从句及其对应的原因从句视为一个整体,称为情绪原因对,联合提取二者。提取的情绪-原因对包含了丰富的情绪原因信息,在深入的情绪分析中起着关键作用。这项任务在最近的研究中引起了广泛关注。

图1是ECPE任务的一个文档和提取的情绪原因对,文档中包含五个连续子句。C1是一个情绪从句,带有情绪词“Excited”,同时C1也是自己对应的原因从句。其中情绪“Excited”是由短语“See the paintings”引起的。同样,C4也是情绪从句带有情绪词“Guilty”,但引起“Guilty”情绪的原因并不包含在C4中。阅读文档中的其他从句可以发现,C5是与C4相对应的原因从句。此任务的目标是提取情绪原因对集合:[(C1,C1),(C4,C5)]。

与给定情绪的原因提取任务相比,情绪-原因对提取是一项更具有挑战性的任务。以往对情绪-原因对提取的研究主要分为两类:管道模型和端到端模型。管道模型由两部分组成:第一步设计算法分别提取情绪子句和原因子句,第二步将第一步提取的情绪子句和原因子句进行匹配。然而管道模型具有严重的缺陷,由于第一步产生的错误可能会传播并影响第二步的性能,因此管道模型的性能受到限制。为了解决这个问题,端到端的情绪原因对算法被提出,大多数现有的端到端模型使用二维表示来表示情绪-原因对,并基于不同的神经模型对其进行预测。

虽然这些研究提高了情绪-原因对提取的性能,但仍然存在以下三个问题。(1)大多数相关研究将从句分为两种类型:情绪和原因,忽略了事实上有四种类型的从句:情绪,原因,既是情绪也是原因和既不是情绪也不是原因。用于检测情绪和原因的传统二元分类可能会被其他两种类型误导。(2)情绪从句和原因从句通常由一些特定的词决定,这些词使从句成为情绪从句或原因从句。这些独特的词通常具有事先已知的特定属性,然而最近的工作中并不包含这些先验知识,事实上人类在情绪原因的判断中也会受到先验知识的影响。(3)现有的工作中通常根据真实情绪-原因对相对位置进行编码或生成位置矩阵,这可能会受到不精确情绪假设子句和文档长度不平衡的负面影响。

发明内容

本发明的目的是提供一种情绪原因识别算法,克服现有的情绪原因模型中从句类型区分不全的缺点。本发明将情绪原因对提取作为一种新的基于知识的多分类任务,并提出了一种基于图的位置嵌入约束。本发明将从句分为四种类型:情绪从句、原因从句、情绪原因从句和非情绪原因从句。首先,设计了一个子任务来提取这四种类型的从句,该子任务利用了语义嵌入和先验情绪信息。然后,针对训练数据集情绪原因对位置构造加权有向图,并传播边权重信息以获得边的上下文信息。随后,综合入度、出度和边上下文信息,得到位置嵌入。最后,设计基于窗口大小的情绪原因对提取模型。

本发明的技术方案为:

基于知识驱动多分类和图位置嵌入的情绪原因对提取方法,包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210805075.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top