[发明专利]一种基于分层策略网络的事件抽取方法及设备在审
申请号: | 202110022760.2 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112836504A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 赵翔;黄培馨;谭真;胡升泽;肖卫东;胡艳丽;张军;李硕豪 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 策略 网络 事件 抽取 方法 设备 | ||
本发明公开了一种基于分层策略网络的事件抽取方法及设备,所述方法包括以下步骤:构建分层策略网络;在从句子头向句子尾扫描的过程中,事件级策略网络在每个分词处检测触发词并且对检测出来的触发词分类事件类型;一旦一个特定的事件被检测出来,论元级策略网络将被触发,开始从头到尾扫描句子,以检测当前这个事件的参与论元;一旦一个论元被识别出来,角色级策略网络将被触发,以预测当前事件下,这个论元在事件中扮演的角色;当角色预测完成,论元级策略网络会继续从当前论元的分词处往后扫描句子来检测事件的其他论元直到扫描到句子尾;之后事件级的策略网将继续从当前事件的分词处往后扫描句子来检测句子包含的其他事件直到扫描到句子尾。
技术领域
本发明涉及自然语言处理中的文本事件抽取技术领域,尤其涉及一种基于分层策略网络的事件抽取方法及设备。
背景技术
事件抽取(Event extraction,EE)在许多自然语言处理上层应用如信息检索和新闻摘要等等中都起着十分重要的作用。事件抽取的目的是发现特定触发词所触发的事件以及事件的论元。通常来说,事件抽取包含几个子任务:触发词识别,触发词分类,事件论元识别和论元角色分类。
现有的一些事件抽取工作采用流水线式方法处理这些子任务,即,分阶段的进行事件检测(包括事件触发词识别和分类)和事件论元分类。这些方法通常假设文本中的实体信息都已经被标注好(非专利文献:McClosky et al.,2011; Chen et al.,2015;Yang etal.,2019)。然而,这些分阶段的抽取模型没有任何策略来充分利用子任务之间的信息交互,事件抽取子任务之间不能相互传递信息以提升它们的决策。尽管当前已经有了一些联合模型通过构建联合的抽取器来进行事件抽取(非专利文献:Yang and Mitchell,2016;Nguyen and Nguyen,2019; Zhang et al.,2019),这些模型在本质上还是遵循流水线式的框架,首先联合识别实体和触发词,然后检测每个实体-事件对来识别论元以及论元角色。另外,在现有技术中策略梯度法(Sutton et al.,1999)和REINFORCE算法(Williams,1992)可以用于进行事件检测模型的参数优化。
这些模型都会面临的一个问题是它们都会产生冗余的实体-事件对信息,因此也会带来可能的误差;另一个可能面临的是当一个句子包含多个事件时可能会存在论元和触发词之间的误匹配问题,使得事件抽取的性能不佳。
举例来说,考虑下面这个句子:In Baghdad,a cameraman died when anAmerican tank fired on the Palestine hotel.在这个句子中,“cameraman”不仅是事件Die(触发词“died”)的Victim论元,而且也是事件Attack(触发词“fired”)的 Target论元。然而,由于“cameraman”在文本中距离触发词“fired”比较远,事件抽取器很有可能识别不出“cameraman”为事件Attack的一个论元。
非专利文献详情:
David McClosky,Mihai Surdeanu,and Christopher D.Manning.2011.Eventextraction as dependency parsing.In The 49th Annual Meeting of theAssociation for Computational Linguistics:Human Language Technologies,Proceedings of the Conference,19-24June,2011,Portland,Oregon,USA,pages 1626–1635.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110022760.2/2.html,转载请声明来源钻瓜专利网。