[发明专利]文本事件的获取方法、装置、电子设备及存储介质有效
| 申请号: | 202010350403.4 | 申请日: | 2020-04-28 |
| 公开(公告)号: | CN111597302B | 公开(公告)日: | 2022-02-15 |
| 发明(设计)人: | 岳重阳;冯少辉;李鹏 | 申请(专利权)人: | 北京中科智加科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/295;G06F40/30 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 马瑞 |
| 地址: | 100083 北京市海淀区学院路*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 事件 获取 方法 装置 电子设备 存储 介质 | ||
1.一种文本事件的获取方法,其特征在于,包括以下步骤:
对文本进行分词和标注处理,以得到对应于所述文本的多个分词,其中,每个分词对应一个标记;所述标记包括词性标记和命名实体标记;
根据分词的标记,从所述多个分词中获取与预设的DSL序列中多个要素属性相关联的多个目标分词;
根据所述多个目标分词得到所述文本事件;
其中,所述DSL序列是根据所需获取的事件要素创建的;
所述根据所需获取的事件要素创建所述DSL序列,包括:
根据所需获取的事件要素,确定所述DSL序列的事件类型配置项和多个事件要素配置项,其中,每一个事件要素配置项包括要素属性及其对应的要素名称;所述事件要素配置项包括:主体要素配置项、触发动作要素配置项、客体要素配置项、时间要素配置项和地点要素配置项;所述事件类型配置项、主体要素配置项、触发动作要素配置项、客体要素配置项、时间要素配置项和地点要素配置项包括的要素属性分别为事件类型的内容、词性标记及命名实体标记、动作识别符、词性标记及命名实体标记、时间信息的位置标识符和地点信息的位置标识符;
应用预设的DSL语法规则,根据所述事件类型配置项和所述多个事件要素配置项创建所述DSL序列。
2.根据权利要求1任一项所述的文本事件的获取方法,其特征在于,所述根据分词的标记,从所述多个分词中获取与预设的DSL序列中多个要素属性相关联的多个目标分词,包括:
根据所述DSL序列的多个事件要素配置项,得到一一对应于所述多个事件要素配置项的多个要素抽取任务;
根据所述多个要素抽取任务中当前执行的要素抽取任务,依次遍历所述多个分词,以根据分词的标记,从所述多个分词中获取与所述当前执行的要素抽取任务相关联的目标分词。
3.根据权利要求2所述的文本事件的获取方法,其特征在于,所述多个要素抽取任务包括主体要素抽取任务、触发动作要素抽取任务、客体要素抽取任务、时间要素抽取任务和地点要素抽取任务,所述根据分词的标记,从所述多个分词中获取与所述当前执行的要素抽取任务相关联的目标分词,包括:
如果所述当前执行的要素抽取任务为主体要素抽取任务、触发动作要素抽取任务或者客体要素抽取任务,则获取的所述目标分词为:根据分词的标记,从所述多个分词中匹配到的与所述当前执行的要素抽取任务中要素属性相关的分词;
如果所述当前执行的要素抽取任务为时间要素抽取任务或者地点要素抽取任务,则获取的所述目标分词为:根据分词的标记,根据所述当前执行的要素抽取任务中要素属性对应的查找方式从所述多个分词中查找到的分词;
其中,所述查找方式可根据需求定制。
4.一种文本事件的获取装置,其特征在于,包括:
预处理模块,用于对文本进行分词和标注处理,以得到对应于所述文本的多个分词,其中,每个分词对应一个标记;所述标记包括词性标记和命名实体标记;
获取模块,用于根据分词的标记,从所述多个分词中获取与预设的DSL序列中多个要素属性相关联的多个目标分词;
文本事件确定模块,用于根据所述多个目标分词得到所述文本事件;
其中,所述DSL序列是根据所需获取的事件要素创建的;
所述装置还包括:
DSL序列创建模块,用于根据所需获取的事件要素,确定所述DSL序列的事件类型配置项和多个事件要素配置项;其中,每一个事件要素配置项包括要素属性及其对应的要素名称;所述事件要素配置项包括:主体要素配置项、触发动作要素配置项、客体要素配置项、时间要素配置项和地点要素配置项;所述事件类型配置项、主体要素配置项、触发动作要素配置项、客体要素配置项、时间要素配置项和地点要素配置项包括的要素属性分别为事件类型的内容、词性标记及命名实体标记、动作识别符、词性标记及命名实体标记、时间信息的位置标识符和地点信息的位置标识符;并应用预设的DSL语法规则,根据所述事件类型配置项和所述多个事件要素配置项创建所述DSL序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科智加科技有限公司,未经北京中科智加科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010350403.4/1.html,转载请声明来源钻瓜专利网。





