[发明专利]基于新闻事件的关系分析方法及装置在审

专利信息
申请号: 202110326769.2 申请日: 2021-03-26
公开(公告)号: CN113158672A 公开(公告)日: 2021-07-23
发明(设计)人: 侯磊;刘丁枭;吴茜凤;李涓子;张鹏;唐杰;许斌 申请(专利权)人: 清华大学
主分类号: G06F40/295 分类号: G06F40/295;G06F40/242;G06F40/30;G06K9/62;G06F16/36
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 苗晓静
地址: 100084 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 新闻 事件 关系 分析 方法 装置
【说明书】:

发明提供一种基于新闻事件的关系分析方法及装置,其中方法包括:获取多篇新闻文本;对多篇新闻文本进行聚类,得到聚类后的多个新闻事件;对多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取、实体与事件关系抽取,根据实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果、实体与事件关系抽取结果进行关联分析得到分析结果。本发明通过原始新闻文本聚类实现新闻事件级别分析,得到多个事件,再通过对事件文本抽取实体、实体关系、事件关系、事件与实体的关系。进而通过实体链接,将实体背景知识进行补充,实现对事件的深层次挖掘,从而使读者能够获得更全面和深入的信息。

技术领域

本发明涉及计算机技术领域,尤其涉及一种基于新闻事件的关系 分析方法及装置。

背景技术

随着互联网普及率的上升和信息公开化程度的提高,网络已经成 为新闻事件报道和传播的重要平台。互联网上新闻网页的数量急剧增 长,新闻量和冗余信息的增加,给阅读和信息分析带来了新的挑战。 而由于互联网的开放性特征,发布在网站上的新闻信息可能会繁杂无 序,描述同一新闻事件的新闻信息可能会分散在不同的网站上,不利 于用户的深入了解。当用户要想了解与这个新闻事件的来龙去脉时, 需要一次一次的输入去做查找,非常耗时。

而现有的技术为了对新闻事件进行分析主要是对新闻正文进行 简单分类或者基于新闻内容提取相应的关键词,并不能全面体现一则 新闻的所包含的信息。或者仅仅对新闻事件进行聚类,将相同事件进 行集中展现,是读者获取更多相应信息,但是这种方式并不能对不同 种类的新闻进行聚合,不能对信息进行跨类别的融合,不能体现出新 闻中不包含的背景知识,不能使读者获取更为深入或者全面的信息, 从而加深对新闻的理解。

发明内容

本发明提供一种基于新闻事件的关系分析方法及装置,用以解决 现有技术中读者不能获取深入而全面的背景信息的缺陷,实现信息的 跨类融合,补充新闻信息中的背景知识信息,使读者更为深入而全面 的理解新闻。

第一方面,本发明提供一种基于新闻事件的关系分析方法,包括:

获取多篇新闻文本;

对所述多篇新闻文本进行聚类,得到聚类后的多个新闻事件;

对所述多个新闻事件进行实体链接、实体抽取、实体关系抽取、 事件关系抽取以及实体与事件关系抽取,得到实体链接结果、实体抽 取结果、实体关系抽取结果、事件关系抽取结果,以及实体与事件关 系抽取结果;

根据所述实体链接结果、所述实体抽取结果、所述实体关系抽取 结果、所述事件关系抽取结果,以及所述实体与事件关系抽取结果进 行关联分析得到分析结果。

进一步地,根据本发明提供的一种基于新闻事件的关系分析方法, 其中,对所述多篇新闻文本进行聚类,得到聚类后的多个新闻事件, 包括:

对所述多篇新闻文本进行K均值聚类、基于密度的聚类、均值 漂移聚类或层次聚类,得到多个新闻事件。

进一步地,根据本发明提供的一种基于新闻事件的关系分析方法, 其中,对所述多个新闻事件进行实体关系抽取,包括下述中的一种或 多种:

对所述多个新闻事件进行语料级的实体关系抽取;

对所述多个新闻事件进行句子级的实体关系抽取;

对所述多个新闻事件从实体链接得到的实体链接结果进行实体 关系扩展。

进一步地,根据本发明提供的一种基于新闻事件的关系分析方法, 其中,在对所述多个新闻事件进行实体关系抽取时,采用开放域关系 抽取;其中,所述开放域关系抽取是指基于实体对和上下文中的连接 词描述实体之间的关系。

进一步地,根据本发明提供的一种基于新闻事件的关系分析方法, 其中,对所述多个新闻事件进行事件关系抽取,包括下述中的一种或 多种:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110326769.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top