[发明专利]基于自然语言的舆情追踪方法及装置在审

专利信息
申请号: 202310525692.0 申请日: 2023-05-10
公开(公告)号: CN116521877A 公开(公告)日: 2023-08-01
发明(设计)人: 李鑫;李锦涛;高敏敏;潘涛 申请(专利权)人: 精英数智科技股份有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/284
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 邓超
地址: 030000 山西省太原市小*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 自然语言 舆情 追踪 方法 装置
【说明书】:

发明提供了一种基于自然语言的舆情追踪方法及装置,根据目标主题获取包括多个舆情样本的原始互联网舆情;基于预先建立的目标主题对应的标签库以及每个舆情样本的标题和内容,获取每个舆情样本的标签列表;基于标签库和目标主题对应的关键词对每个舆情样本的标签列表进行分类,得到与目标主题关联的第一类样本;基于标签库为每个第一类样本标注相应的关键信息标签,并获取每个第一类样本的事件发生时间;按照关键信息标签和事件发生时间将全部第一类样本聚合成一个或多个舆情集合,并对每个舆情集合进行舆情追踪。采用本发明可以缓解现有舆情处理方式中存在的关键信息丢失、处理较复杂的问题。

技术领域

本发明涉及自然语言处理技术领域,尤其是涉及一种基于自然语言的舆情追踪方法及装置。

背景技术

随着互联网技术的不断发展,现如今互联网信息交互流通庞大、互联网信息更新速度快,想要及时掌握行业舆情动态以及事件在互联网中的发酵程度和关注度,舆情的追踪显得尤为重要。为了实时监测行业舆情,尤其是在事件发生后需要将互联网上关于事件的报道及时反馈给相关部门,现有舆情处理方式主要涉及高频词的TF-IDF、Kmeans、LRC等算法的处理。虽然通过这些算法可以较好的提取出舆情中的高频词,但是针对单篇舆情仅根据高频词判定舆情关键信息可能会丢失一些重点词,从而导致在后续舆情分析时丢失更多的关键信息。

发明内容

有鉴于此,本发明的目的在于提供一种基于自然语言的舆情追踪方法及装置,以缓解现有舆情处理方式中存在的关键信息丢失、处理较复杂的问题。

第一方面,本发明实施例提供了一种基于自然语言的舆情追踪方法,所述方法包括:根据目标主题获取原始互联网舆情;其中,所述原始互联网舆情包括多个舆情样本;基于预先建立的所述目标主题对应的标签库以及每个舆情样本的标题和内容,获取每个舆情样本的标签列表;基于所述标签库和所述目标主题对应的关键词对每个舆情样本的标签列表进行分类,得到与所述目标主题关联的第一类样本;基于所述标签库为每个第一类样本标注相应的关键信息标签,并获取每个第一类样本的事件发生时间;按照关键信息标签和事件发生时间将全部第一类样本聚合成一个或多个舆情集合,并对每个舆情集合进行舆情追踪。

第二方面,本发明实施例还提供一种基于自然语言的舆情追踪装置,所述装置包括:第一获取模块,用于根据目标主题获取原始互联网舆情;其中,所述原始互联网舆情包括多个舆情样本;第二获取模块,用于基于预先建立的所述目标主题对应的标签库以及每个舆情样本的标题和内容,获取每个舆情样本的标签列表;分类模块,用于基于所述标签库和所述目标主题对应的关键词对每个舆情样本的标签列表进行分类,得到与所述目标主题关联的第一类样本;第一处理模块,用于基于所述标签库为每个第一类样本标注相应的关键信息标签,并获取每个第一类样本的事件发生时间;第二处理模块,用于按照关键信息标签和事件发生时间将全部第一类样本聚合成一个或多个舆情集合,并对每个舆情集合进行舆情追踪。

本发明实施例提供的一种基于自然语言的舆情追踪方法及装置,根据目标主题获取包括多个舆情样本的原始互联网舆情;基于预先建立的目标主题对应的标签库以及每个舆情样本的标题和内容,获取每个舆情样本的标签列表;基于标签库和目标主题对应的关键词对每个舆情样本的标签列表进行分类,得到与目标主题关联的第一类样本;基于标签库为每个第一类样本标注相应的关键信息标签,并获取每个第一类样本的事件发生时间;按照关键信息标签和事件发生时间将全部第一类样本聚合成一个或多个舆情集合,并对每个舆情集合进行舆情追踪。采用上述技术,针对单个舆情样本可以比较全面、准确地提取出关键信息,且操作方式简单、计算速度快,可以便于相关人员根据舆情追踪结果及时做出响应。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于精英数智科技股份有限公司,未经精英数智科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310525692.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top