[发明专利]事件知识库的构建方法及装置有效
申请号: | 201410010694.7 | 申请日: | 2014-01-09 |
公开(公告)号: | CN103699689B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 孙珂;赵世奇;忻舟;王海峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 知识库 构建 方法 装置 | ||
1.一种事件知识库的构建方法,其特征在于,包括:
对文本进行识别,识别出事件挖掘候选语句;
对识别出的所述事件挖掘候选语句进行片段切分,获得句法片段;
根据所述句法片段和预定义的事件知识结构,生成事件知识实例,其中,所述事件知识实例的个数等于所述句法片段中包含的动宾片段和主谓片段的个数;以及
根据所述句法片段中包含的动宾片段和主谓片段获得对应的事件挖掘目标语句,对获得的事件挖掘目标语句进行成分划分,并将划分后的成分对应写入所述事件知识实例中,以完成所述事件知识库的构建。
2.如权利要求1所述的方法,其特征在于,所述句法片段包括主谓片段、动宾片段、状语片段、主语片段和名词谓语片段中的一种或多种。
3.如权利要求1所述的方法,其特征在于,所述预定义的事件知识结构包括事件知识实例标识、主实体、宾实体和动作四个属性,所述主实体包括动作的发起者对应的实体信息及其修饰信息,所述宾实体包括动作的承受者对应的实体信息及其修饰信息,所述动作包括核心动作及其约束信息。
4.如权利要求3所述的方法,其特征在于,所述对获得的事件挖掘目标语句进行成分划分,并将划分后的成分对应写入所述事件知识实例中,包括:
对获得的事件挖掘目标语句中的主谓片段进行成分划分,将划分出的所有成分对应写入所述事件知识实例的主实体、宾实体和动作中;
确定获得的事件挖掘目标语句中的动宾片段存在主语片段时,将所述主语片段写入所述事件知识实例的主实体中,对所述动宾片段进行成分划分,将划分出的所有成分对应写入所述事件知识实例的宾实体和动作中;以及
将获得的事件挖掘目标语句中除主谓片段、动宾片段之外的句法片段进行成分划分,将划分出的所有成分对应写入所述事件知识实例的修饰信息和约束信息中;
其中,所述成分包括主语、谓语、宾语、主语定语、状语和宾语定语中的一种或多种。
5.如权利要求4所述的方法,其特征在于,还包括:
确定获得的事件挖掘目标语句中的动宾片段不存在主语片段时,丢弃所述动宾片段。
6.如权利要求5所述的方法,其特征在于,所述将划分后的成分对应写入所述事件知识实例中之后,还包括:
对所述事件知识库中的事件知识实例进行聚类分析,获得等价事件集合;以及
将所述等价事件集合中所有事件知识实例的信息写入所述事件知识库中,形成一个新的事件知识实例。
7.如权利要求6所述的方法,其特征在于,所述对所述事件知识库中的事件知识实例进行聚类分析,获得等价事件集合,包括:
对所述事件知识库中的主实体、宾实体且动作的约束信息一致的所有事件知识实例进行聚类,获得第一等价事件,抽取出所述第一等价事件中的核心动作,生成等价动作词典;以及
对所述事件知识库中的主实体和宾实体一致的所有事件知识实例进行聚类,获得第二等价事件,根据所述等价动作词典从所述第二等价事件中挑选出所有核心动作等价的事件知识实例,生成等价事件集合。
8.一种事件知识库的构建装置,其特征在于,包括:
识别模块,用于对文本进行识别,识别出事件挖掘候选语句;
切分模块,用于对所述识别模块识别出的所述事件挖掘候选语句进行片段切分,获得句法片段;
生成模块,用于根据所述切分模块获得的所述句法片段和预定义的事件知识结构,生成事件知识实例,其中,所述事件知识实例的个数等于所述句法片段中包含的动宾片段和主谓片段的个数;以及
写入模块,用于根据所述句法片段中包含的动宾片段和主谓片段获得对应的事件挖掘目标语句,对获得的事件挖掘目标语句进行成分划分,并将划分后的成分对应写入所述事件知识实例中,以完成所述事件知识库的构建。
9.如权利要求8所述的装置,其特征在于,所述句法片段包括主谓片段、动宾片段、状语片段、主语片段和名词谓语片段中的一种或多种。
10.如权利要求8所述的装置,其特征在于,所述预定义的事件知识结构包括事件知识实例标识、主实体、宾实体和动作四个属性,所述主实体包括动作的发起者对应的实体信息及其修饰信息,所述宾实体包括动作的承受者对应的实体信息及其修饰信息,所述动作包括核心动作及其约束信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410010694.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带藏帽领的服装
- 下一篇:一种改良的烤烟检测系统装置