[发明专利]一种事件提取方法、装置、电子设备及存储介质在审
申请号: | 202110921072.X | 申请日: | 2021-08-11 |
公开(公告)号: | CN113723108A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 李建强;杨鲤银;赵琳娜 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/33;G06N3/02;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王宇杨 |
地址: | 100022 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 提取 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种事件提取方法、装置、电子设备及存储介质。所述方法包括:获取目标文本,将目标文本输入至事件提取模型中,得到事件提取结果;事件提取模型是基于目标文本和目标文本对应的正负样本,通过对比学习的方式进行训练后得到的;目标文本对应的正样本为表达目标文本上下文语义的第一特征向量,目标文本对应的负样本为表达目标文本局部语义的第二特征向量。本申请实施例通过经过对比学习训练的事件提取模型进行文本事件提取,可以减少文本局部语义信息的干扰,提高识别文本事件的准确率。
技术领域
本申请涉及计算机技术领域,具体涉及一种事件提取方法、装置、电子设备及存储介质。
背景技术
事件抽取(Event Extraction,EE)是自然语言处理领域中一种经典的信息抽取任务,其从含有事件信息的非结构化文本中抽取出用户感兴趣的事件信息,以结构化的形式呈现出来,在商业和军事等领域的情报工作中应用非常广泛。
在现有技术中,通常是基于传统神经网络模型对文本全文语义特征进行捕捉,然而这种网络模型对文本上下文的语义特征的捕捉并不充分,无法捕捉到更丰富的语境特征,存在局部语义信息的干扰,影响了最终的事件抽取效果。
发明内容
由于现有方法存在上述问题,本申请实施例提供一种事件提取方法、装置、电子设备及存储介质。
具体的,本申请实施例提供了以下技术方案:
第一方面,本申请实施例提供了一种事件提取方法,包括:
获取目标文本,将所述目标文本输入至事件提取模型中,得到事件提取结果;
其中,所述事件提取模型是基于所述目标文本和所述目标文本对应的正负样本,通过对比学习的方式进行训练后得到的;所述目标文本对应的正样本为表达所述目标文本上下文语义的第一特征向量,所述目标文本对应的负样本为表达所述目标文本局部语义的第二特征向量。
可选的,所述事件提取模型由循环神经网络和卷积神经网络组成;
其中,所述循环神经网络用于提取所述目标文本上下文语义的第一特征向量,所述卷积神经网络用于提取所述目标文本局部语义的第二特征向量。
可选的,所述事件提取模型基于以下步骤进行训练,包括:
步骤1:提取所述目标文本中的词并映射为词向量;
步骤2:将所述词向量输入至循环神经网络和卷积神经网络中,分别得到表达所述目标文本上下文语义的第一特征向量和表达所述目标文本局部语义特征的第二特征向量;
步骤3:根据所述第一特征向量和所述第二特征向量,求解预设的对比损失函数,所述对比损失函数越小表示所述第一特征向量和所述而特征向量越接近;
步骤4:通过不断优化所述对比损失函数进行所述循环神经网络和所述卷积神经网络的优化,当所述对比损失函数小于预设阈值时训练结束,从而获取训练好的由所述循环神经网络和所述卷积神经网络所组成的事件提取模型。
可选的,将所述词向量输入至循环神经网络中,得到表达所述目标文本上下文语义的第一特征向量,包括:
将所述词向量输入至循环神经网络中,得到所述循环神经网络正向输出的所述目标文本上文特征向量和后向输出的所述目标文本下文特征向量;
将所述上文特征向量与所述下文特征向量进行特征融合,得到表达所述目标文本上下文语义的第一特征向量。
可选的,所述对比损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110921072.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于不确定性风险计算的电网新能源接入方法
- 下一篇:风力发电机组及其控制系统