[发明专利]基于新闻事件的关系分析方法及装置在审
申请号: | 202110326769.2 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113158672A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 侯磊;刘丁枭;吴茜凤;李涓子;张鹏;唐杰;许斌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/242;G06F40/30;G06K9/62;G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 苗晓静 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 新闻 事件 关系 分析 方法 装置 | ||
1.一种基于新闻事件的关系分析方法,其特征在于,包括:
获取多篇新闻文本;
对所述多篇新闻文本进行聚类,得到聚类后的多个新闻事件;
对所述多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取以及实体与事件关系抽取,得到实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果,以及实体与事件关系抽取结果;
根据所述实体链接结果、所述实体抽取结果、所述实体关系抽取结果、所述事件关系抽取结果,以及所述实体与事件关系抽取结果进行关联分析得到分析结果。
2.根据权利要求1所述的新闻事件的关系分析方法,其特征在于,对所述多篇新闻文本进行聚类,得到聚类后的多个新闻事件,包括:
对所述多篇新闻文本进行K均值聚类、基于密度的聚类、均值漂移聚类或层次聚类,得到多个新闻事件。
3.根据权利要求1所述的新闻事件的关系分析方法,其特征在于,对所述多个新闻事件进行实体关系抽取,包括下述中的一种或多种:
对所述多个新闻事件进行语料级的实体关系抽取;
对所述多个新闻事件进行句子级的实体关系抽取;
对所述多个新闻事件从实体链接得到的实体链接结果进行实体关系扩展。
4.根据权利要求1~3任一项所述的新闻事件的关系分析方法,其特征在于,在对所述多个新闻事件进行实体关系抽取时,采用开放域关系抽取;其中,所述开放域关系抽取是指基于实体对和上下文中的连接词描述实体之间的关系。
5.根据权利要求1所述的新闻事件的关系分析方法,其特征在于,对所述多个新闻事件进行事件关系抽取,包括下述中的一种或多种:
对所述多个新闻事件进行因果事件关系抽取;
对所述多个新闻事件进行子事件关系抽取;
对所述多个新闻事件进行时序事件关系抽取。
6.根据权利要求1所述的新闻事件的关系分析方法,其特征在于,对所述多个新闻事件进行实体与事件关系抽取,包括:
确定实体与事件的关联关系;
根据所述实体与事件的关联关系,对所述多个新闻事件进行实体与事件关系抽取。
7.根据权利要求1所述的新闻事件的关系分析方法,其特征在于,对所述多个新闻事件进行实体链接,得到实体链接结果,包括:
建立词和实体的联合表示模型;
基于所述词和实体的联合表示模型,采用概率实体模型,建立多个新闻事件中的实体与所述知识库中的实体的链接关系,得到实体链接结果。
8.一种基于新闻事件的关系分析装置,其特征在于,包括:
第一获取模块,用于获取多篇新闻文本;
第二获取模块,用于对所述多篇新闻文本进行聚类,得到聚类后的多个新闻事件;
关系处理模块,用于对所述多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取以及实体与事件关系抽取,得到实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果,以及实体与事件关系抽取结果;
关系分析模块,用于根据所述实体链接结果、所述实体抽取结果、所述实体关系抽取结果、所述事件关系抽取结果,以及所述实体与事件关系抽取结果进行关联分析得到分析结果。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110326769.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种五金材料加工用夹持装置
- 下一篇:一种插接式润滑剂加药装置