[发明专利]舆情识别模型训练方法、系统以及舆情风险监测方法和系统有效

专利信息
申请号: 202110563119.X 申请日: 2021-05-24
公开(公告)号: CN113342972B 公开(公告)日: 2023-02-28
发明(设计)人: 范芳芳;陈娟 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/295;G06N20/20
代理公司: 北京市一法律师事务所 11654 代理人: 李琳娜;刘荣娟
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 舆情 识别 模型 训练 方法 系统 以及 风险 监测
【说明书】:

本说明书提供的舆情识别模型训练方法、系统以及舆情风险监测方法和系统,能够基于历史时间周期对多个历史内容数据基于时间维度进行划分,将多个历史数据划分为多个样本数据,并基于多个样本数据训练舆情识别模型。每个样本数据中包括多个样本内容数据。因此,训练得到的舆情识别模型能够识别出由多个内容数据相机结合引发的舆情风险。在进行舆情风险监测时,所述舆情风险监测方法和系统能够将目标时间窗口内的多个目标内容数据相结合作为一个目标舆情数据,并通过训练好的舆情识别模型对目标舆情数据进行识别,以识别出多个目标内容数据结合后是否存在舆情风险,提高舆情风险识别的准确率。

技术领域

本说明书涉及互联网技术领域,尤其涉及一种舆情识别模型训练方法、系统以及舆情风险监测方法和系统。

背景技术

随着信息社会的发展和互联网的普及,社会各类信息呈现出传播渠道多、传播速度快、传播范围广的特点,容易形成网络舆情。而互联网舆论环境复杂,网络谣言、非理性声音极易引发公众对立情绪。特别是在用户生成内容类网络平台中,大量用户生成的内容数据在给信息交流带来快捷方便的同时,也会产生一些风险,如黄堵毒、暴恐症、违禁广告、欺诈等,这些风险将给应用平台以及用户带来信用风险,成为酿成重大恶性事件的导火索。因此,为了尽可能减少矛盾激化、降低重大恶性事件的发生等,就需要及时了解舆论并加强对舆情监控。现有技术中对用户生成的内容数据进行预警的方法主要是通过自然语言识别模型对每一条内容数据进行识别,并将每一条内容数据与关键词库中的关键词进行匹配,以识别存在风险的内容数据。但在实际应用场景中,风险不仅仅存在于单条内容数据之中,伴随着大量的单条内容数据,存在风险的舆情信息也随之产生。现有技术中无法对大量内容数据中隐含的风险进行提前感知,一旦发生风险将引起严重的后果。

因此,需要提供一种能够提前感知风险的舆情识别模型训练方法、系统以及舆情风险监测方法和系统。

发明内容

本说明书提供一种能够提前感知风险的舆情识别模型训练方法、系统以及舆情风险监测方法和系统,能够提前预测出由多条内容数据相结合构成的风险,提高舆情风险识别的准确性。

第一方面,本说明书提供一种舆情识别模型训练方法,包括:从目标应用平台中获取多个讨论区对应的多个历史舆情数据,每个所述历史舆情数据至少包括多个历史内容数据以及所述多个历史内容数据对应的时间,每个所述历史舆情数据来自所述多个讨论区中的同一个讨论区;基于历史时间周期以及所述多个历史内容数据对应的时间,将每个所述历史舆情数据划分为多个样本数据,所述多个样本数据对应多个历史时刻,每个所述样本数据包括与其对应的历史时刻之前的历史时间窗口内的多个样本内容数据,所述多个历史内容数据包括所述多个样本内容数据;获取每个所述样本数据的风险等级标签及其风险等级标签;以及基于所述多个样本数据对分类模型进行训练,得到所述舆情识别模型。

在一些实施例中,所述历史时间窗口大于所述历史时间周期。

在一些实施例中,每个所述样本数据还包括所述多个样本内容数据对应的历史属性数据,所述历史属性数据包括所述多个样本内容数据的来源。

在一些实施例中,每个所述样本数据还包括所述多个样本内容数据对应的历史用户数据,所述历史用户数据包括历史用户行为数据以及历史用户属性数据中的至少一个。

在一些实施例中,每个所述样本数据还包括所述多个样本内容数据对应的评价指标,所述评价指标包括负面内容指标、正面内容指标、内容质量指标、内容重复指标、恶意广告指标、底线风险浓度指标以及风险浓度指标中的至少一个。

第二方面,本申请还提供一种舆情识别模型训练系统,包括至少一个存储介质以及至少一个处理器,所述至少一个存储介质存储有至少一个指令集用于舆情识别模型的训练;所述至少一个处理器同所述至少一个存储介质通信连接,其中,当所述舆情识别模型的训练系统运行时,所述至少一个处理器读取所述至少一个指令集并实施本说明书第一方面所述的舆情识别模型训练方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110563119.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top