[发明专利]事件关系预测方法、装置、电子设备、介质及程序产品在审
申请号: | 202310325479.5 | 申请日: | 2023-03-29 |
公开(公告)号: | CN116501868A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 李涓子;关勇;侯磊;王晓智;李亚坤;孟斌杰;张鹏;唐杰;许斌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/126;G06F40/194;G06F40/30;G06F18/23213;G06F18/214;G06N3/0464;G06N3/084 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 谢志超 |
地址: | 100084 北京市海淀区双清路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 关系 预测 方法 装置 电子设备 介质 程序 产品 | ||
本发明实施例提供一种事件关系预测方法、装置、电子设备、介质及程序产品,该方法包括:对输入文本进行聚类得到多个互不相交的原始组;对原始组进行两两融合得到多个交叉组;利用摘要生成模型生成原始组的第一摘要及交叉组的第二摘要;分别获取输入文本、第一摘要及第二摘要中的事件的向量表示及事件对的向量表示;根据输入文本、第一摘要及第二摘要中事件对的向量表示获取待预测事件对的向量表示;将待预测事件对的向量表示输入至预训练的事件关系预测模型,输出待预测事件对的事件关系预测结果。本发明实施例有效提升了模型处理长距离事件关系预测的能力,减少事件关系预测过程中遇到的冗余信息的影响,提高了事件关系的预测效率和准确率。
技术领域
本发明实施例涉及计算机技术领域,具体涉及一种事件关系预测方法、装置、电子设备、介质及程序产品。
背景技术
事件关系预测是指抽取给定文章中事件之间的关系,是自然语言处理中的一个研究热点。事件关系主要包括时间、因果和子事件三种关系,通过事件关系抽取可以将文章中的事件知识进行结构化表示,这不仅有助于文本深层理解,而且可以有效推进相关下游任务的学习,比如问答任务、文本摘要、信息抽取等。此外,事件关系预测可以帮助用户从大量文本数据中快速获取主要信息,从而具有很多重要的应用场景,比如新闻报道、社交媒体分析、金融风险预测、文献分析等。
近年来,随着深度学习技术的不断发展和信息量的爆炸式增长,使得能够有效利用大数据且自动学习特征的基于神经网络的方法逐渐成为研究事件关系预测任务的主流方法。该类方法通常首先将整篇文章看作一个序列或者基于事件触发词等信息将文章构成图,使用神经网络模型获取文章中所有事件的向量表示,然后预测事件之间可能存在的关系。
当前事件关系预测方法通常直接建模整篇文章,然后同时预测所有的事件关系,但是实际上仅从事件相关的内容就可以获取事件之间的关系,而不是依赖整篇文章的信息。针对这个问题,有些工作开始建模与事件关系预测相关的文章内容,主要包括两种方式:为事件对筛选重要句子,或者删除文章中不重要的句子来压缩文章内容。第一种方式通过为每一个事件筛选重要的句子,在预测事件关系时仅依赖筛选出的句子信息,但是这种基于句子级的筛选方法仍然会保留大量冗余信息。第二种方式通过删除文章中不重要的句子,达到缩减文章内容的目的,然后建模整个压缩后的文章进行关系预测。但是,这种方法仍然面临长距离依赖的问题,比如预测位于文章首尾两个句子中的事件关系时,由于文章中间存在许多其他事件关系,所以无法有效拉近首尾两句话的距离。
发明内容
针对现有技术存在的缺陷,本发明实施例提供一种事件关系预测方法、装置、电子设备、介质及程序产品。
本发明实施例提供一种事件关系预测方法,包括:对输入文本进行聚类,得到多个互不相交的原始组;对所述原始组进行两两融合,得到多个交叉组;利用预训练的摘要生成模型生成每个所述原始组的第一摘要及每个所述交叉组的第二摘要;分别获取所述输入文本中的事件的向量表示,所述第一摘要中的事件的向量表示及所述第二摘要中的事件的向量表示;根据所述输入文本中的事件的向量表示获取所述输入文本中的事件对的向量表示,根据所述第一摘要中的事件的向量表示获取所述第一摘要中的事件对的向量表示,根据所述第二摘要中的事件的向量表示获取所述第二摘要中的事件对的向量表示;根据所述输入文本中的事件对的向量表示、所述第一摘要中的事件对的向量表示及所述第二摘要中的事件对的向量表示获取待预测事件对的向量表示;将所述待预测事件对的向量表示输入至预训练的事件关系预测模型,输出所述待预测事件对的事件关系预测结果。
根据本发明实施例提供的一种事件关系预测方法,所述摘要生成模型的预训练过程包括:预先获取训练文本的摘要;通过语义相似度比较,在所述训练文本中为所述训练文本的摘要中的句子检索语义最相近的句子作为候选句,从基于所述摘要中的句子得到的所述候选句的集合中抽取事件链信息;将所述事件链信息和所述训练文本的摘要进行拼接得到目标摘要;以所述训练文本作为输入,以所述目标摘要作为输出对所述摘要生成模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310325479.5/2.html,转载请声明来源钻瓜专利网。