[发明专利]一种基于实体连通图的事件模版构造方法有效

专利信息
申请号: 201711071987.6 申请日: 2017-11-03
公开(公告)号: CN107862037B 公开(公告)日: 2021-07-16
发明(设计)人: 秦兵;刘铭;刘挺;刘一仝;李嘉伟 申请(专利权)人: 哈尔滨工业大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/36
代理公司: 哈尔滨市松花江专利商标事务所 23109 代理人: 岳泉清
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 实体 连通 事件 模版 构造 方法
【说明书】:

一种基于实体连通图的事件模版构造方法,本发明涉及事件模板的构造方法。本发明的目的是为了解决现有技术在针对特定事件的“检索”、“问答”等人工智能应用中识别结果及提取特定信息不准确;基于事件的篇章相似度难以定量计算以及篇章关键信息难以提取的问题。过程为:一、对每一句抽取三元组;二、视三元组中的三个元素为三个结点;三、将从文本中抽取到的结点均放入到集合S1中;四、利用词向量计算S1中任两个结点的相似度并依此生成连通图;五、计算各结点的PageRank值;六、确定两篇文本陈述的事件间的关系度量值;七、形成多个文本簇;八、构建粗粒度事件模板和细粒度事件模版。本发明用于篇章关键信息提取及相关度计算领域。

技术领域

本发明涉及事件模板的构造方法,涉及信息处理技术领域。

背景技术

随着互联网技术的飞速发展,网络上充斥着大量的事件,这些事件大多以无结构化的文本形式存在,比如“XX发现了XX”、“XX并购了XX”等,这种无结构化的文本信息很难被应用于类似于“检索”、“问答”、“对话”等人工智能技术中。因此,如何能够从网络文本中自动获取文本中陈述的事件的关联性以将文本划分为多个事件簇进而构造出事件模板是非常有意义的工作。

虽然很多的评测组织(例如ACE)已经定义了事件的类型和事件的结构化表示,比如ACE定义了8大类事件、33个小类事件,但是这种封闭的类型定义本身过于狭隘,已经不适用于当前多种多样的事件类型。并且由于当前多数的事件识别系统均是着眼于从一条语句中识别事件元素,因此每个事件的事件元素的定义也过于简单。比如,在ACE中的“Life/Marry”事件中仅有“人”、“地点”、“时间”这三个事件元素。但是,在很多情况中,这三个元素不足以完整的描述“Life/Marry”事件,比如“出席婚礼的人数”、“主宾”等等也是应该引入的必要的事件元素,但是由于当前的事件识别系统以触发词(针对“Life/Marry”事件,像“结婚”、“举办婚礼”等词或短语均可视为该事件的触发词)识别事件,并仅从触发词所在的句子中抽取事件元素,因此上述这些类似于“出席婚礼的人数”、“主宾”等事件元素是不会被识别出来的,并且“Life/Marry”事件中“人”这个元素应该细分为“丈夫”和“妻子”两个角色,而在ACE中也没有去做。

事实上,以句子级为基准的事件对于信息的覆盖程度非常少的。随着网络上信息的丰富,从篇章一级分析事件将会更有意义。比如,对于“汶川地震”事件,关于地震的等级、造成的影响、救援的程度、后续的援助等等,这些信息是不可能用一句话表述完的。再者,文本陈述的事件之间是存在关联性的。同样以“汶川地震”为例,会有多篇新闻追踪介绍“汶川地震的震况”,另外,也会有新闻或博客分析“汶川地震带来的影响”。这些文本都是围绕着“汶川地震”展开,因此必然存在多种多样的关联性。当对文本中涉及的事件进行分析时,能够发现这种事件间的关联性是非常有意义的。

综上所述现有技术存在针对特定事件的“检索”、“问答”、“对话”等人工智能的应用中识别结果及提取特定信息不准确,事件的篇章相似度难以定量计算以及篇章关键信息难以提取。

发明内容

本发明的目的是为了解决现有技术在针对特定事件的“检索”、“问答”、“对话”等人工智能的应用中识别结果及提取特定信息不准确;基于事件的篇章相似度难以定量计算以及篇章关键信息难以提取的问题,而提出一种基于实体连通图的事件模版构造方法。

一种基于实体连通图的事件模版构造方法具体过程为:

步骤一、利用LTP平台上的依存句法关系分析功能得到文本d中每一句的句法分析结果,对每一句根据句法分析结果抽取主谓宾、主动补、定定中(定语、定语、中心词)三元组(z1,z2,z3);

所述LTP平台为哈工大社会计算与信息检索研究中心研发的语言技术平台;

步骤二、视三元组(z1,z2,z3)中的三个元素为三个结点,并构建三条边用于连接(z1,z2)、(z1,z3)和(z2,z3);

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711071987.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top