[发明专利]事件确定方法、相关设备及可读存储介质在审
申请号: | 202010230897.2 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111460831A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 代旭东;顾成敏;方昕;刘俊华 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王娇娇 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 确定 方法 相关 设备 可读 存储 介质 | ||
本申请公开了一种事件确定方法、相关设备及可读存储介质,基于上述方案,对于待进行事件确定的文本,分别基于该文本的文本级语义信息确定出该文本的事件类型,以及,基于该文本的词级语义信息确定出该文本的事件元素,该文本的事件类型及该文本的事件元素能够组成该文本所描述事件,因此,基于上述方案能够实现从文本中确定事件。
技术领域
本申请涉及自然语言处理技术领域,更具体的说,是涉及一种事件确定方法、相关设备及可读存储介质。
背景技术
随着互联网的高速发展,越来越多的信息以电子文本的形式呈现给用户。为了帮助用户在海量信息中快速找到所需要的信息,提出了信息抽取(Information Extraction)的概念。信息抽取是指从自然语言文本中抽取事实信息,并且以结构化的形式描述信息。
事件抽取(Event Extraction)是信息抽取中的一个重要研究方向,是一种自然语言处理技术。事件抽取的目的是从非结构化或半结构化的文本数据中抽取结构化的数据。事件抽取在信息抽取、语言资源建设、事理图谱建设等相关领域都有着重要的应用前景。
然而,如何从文本中确定事件,成为目前亟待解决的问题。
发明内容
鉴于上述问题,本申请提出了一种事件确定方法、相关设备及可读存储介质。具体方案如下:
一种事件确定方法,包括:
获取待进行事件确定的文本;
确定所述文本的文本级语义信息,以及,所述文本的词级语义信息;
基于所述文本的文本级语义信息,确定所述文本的事件类型,所述事件类型用于表示所述文本所描述事件所属的类型;
基于所述文本的词级语义信息,确定所述文本的事件元素,由所述文本的事件类型及所述文本的事件元素组成所述文本所描述事件。
可选地,所述确定所述文本的文本级语义信息,以及,所述文本的词级语义信息;基于所述文本的文本级语义信息,确定所述文本的事件类型;基于所述文本的词级语义信息,确定所述文本的事件元素的过程,包括:
利用事件确定模型处理所述文本,得到所述事件确定模型输出的所述文本的事件类型,和,所述文本的事件元素;
所述事件确定模型具备,确定所述文本的文本级语义信息,以及,所述文本的词级语义信息;基于所述文本的文本级语义信息,确定所述文本的事件类型;基于所述文本的词级语义信息,确定所述文本的事件元素的能力。
可选地,所述利用事件确定模型处理所述文本,得到所述事件确定模型输出的所述文本的事件类型,和,所述文本的事件元素,包括:
利用事件确定模型的语义信息确定模块,对所述文本进行特征提取,并对提取的特征进行编码,得到所述文本的文本级语义信息,以及,所述文本的词级语义信息;
利用事件确定模型的事件类型确定模块,对所述文本的文本级语义信息进行分类,得到所述文本的事件类型;
利用事件确定模型的事件元素确定模块,对所述文本的词级语义信息进行序列标注,得到所述文本的事件元素。
可选地,所述利用事件确定模型的事件类型确定模块,对所述文本的文本级语义信息进行分类,得到所述文本的事件类型,包括:
利用所述事件类型确定模块中的多层级事件类型确定模块,对所述文本的文本级语义信息进行分类,得到所述文本的多层级事件类型;所述多层级事件类型用于表示所述文本所描述事件在不同层级下所属的类型;和/或,
利用所述事件类型确定模块中的每个单层级事件类型确定模块,对所述文本的文本级语义信息进行分类,得到所述文本在每个单层级事件类型确定模块对应的层级下的事件类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010230897.2/2.html,转载请声明来源钻瓜专利网。