[发明专利]一种基于实体连通图的事件模版构造方法有效
申请号: | 201711071987.6 | 申请日: | 2017-11-03 |
公开(公告)号: | CN107862037B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 秦兵;刘铭;刘挺;刘一仝;李嘉伟 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 岳泉清 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
一种基于实体连通图的事件模版构造方法,本发明涉及事件模板的构造方法。本发明的目的是为了解决现有技术在针对特定事件的“检索”、“问答”等人工智能应用中识别结果及提取特定信息不准确;基于事件的篇章相似度难以定量计算以及篇章关键信息难以提取的问题。过程为:一、对每一句抽取三元组;二、视三元组中的三个元素为三个结点;三、将从文本中抽取到的结点均放入到集合S |
||
搜索关键词: | 一种 基于 实体 连通 事件 模版 构造 方法 | ||
【主权项】:
一种基于实体连通图的事件模版构造方法,其特征在于:所述方法具体过程为:步骤一、利用LTP平台上的依存句法关系分析功能得到文本d中每一句的句法分析结果,对每一句根据句法分析结果抽取主谓宾、主动补、定定中三元组(z1,z2,z3);所述LTP平台为哈工大社会计算与信息检索研究中心研发的语言技术平台;步骤二、视三元组(z1,z2,z3)中的三个元素为三个结点,并构建三条边用于连接(z1,z2)、(z1,z3)和(z2,z3);所述z1,z2,z3为主谓宾、主动补或定定中;步骤三、将从文本d中抽取到的所有三元组中包含的结点均放入到集合S1中;利用LTP平台上的分词功能对文本d进行分词,利用word2vec模型将每一个分词转换成词向量;步骤四、利用词向量计算S1中任两个结点的相似度,如果相似度超过预先定义的阈值,则在两个结点间建立一条边;如果相似度没有超过预先定义的阈值,则不在两个结点间建立一条边;步骤五、计算由S1中所有结点组成的图中各结点的PageRank值;步骤六、通过计算任两篇文本对应的图的重合度来确定两篇文本陈述的事件间的关系的度量值,即为关联度;当计算完文本中陈述的事件间的关联度后,即可形成事件关联分析矩阵,该矩阵的行和列均为文本,矩阵的值代表了文本中陈述的事件间的关联度;用矩阵的行向量表示对应行代表的文本,将文本表示为文本向量的形式;步骤七、使用聚类算法K‑means对步骤六得到的文本向量进行聚类,将文本向量按照相关度划分到多个文本簇中,形成多个文本簇;步骤八、构建粗粒度事件模板和细粒度事件模版;一)、构建粗粒度事件模板:从文本簇内将事件的核心要素识别出来;核心要素为触发词、参与者和时间;二)、构建细粒度事件模版:识别出模板事件元素,然后再从文本簇中针对模板事件元素识别出事件元素对应的值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711071987.6/,转载请声明来源钻瓜专利网。