[发明专利]突发事件报警方法、装置、系统、电子设备及存储介质有效
申请号: | 201910708734.8 | 申请日: | 2019-08-01 |
公开(公告)号: | CN110457595B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 徐灿;李铮 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/33;G06F16/35;G06F40/289;G06Q50/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 突发事件 报警 方法 装置 系统 电子设备 存储 介质 | ||
1.一种突发事件报警方法,其特征在于,包括:
获取待处理的文本数据,所述待处理的文本数据包括当前时间窗口内产生的文本数据和所述当前时间窗口之前的预设数量个历史时间窗口内产生的文本数据;
对所述待处理的文本数据进行分词处理,得到若干个候选词;
针对每个候选词,根据所述当前时间窗口内产生的文本数据,确定所述候选词的第一占比值,所述第一占比值为所述当前时间窗口内包含所述候选词的文本的数量与所述当前时间窗口内的文本总数之比;
针对每个候选词,根据预设数量个历史时间窗口内产生的文本数据,确定所述候选词的预测占比值和波动性特征值,所述预测占比值为基于历史时间窗口内产生的文本数据,对所述候选词在所述当前时间窗口内进行预测得到的占比值,所述波动性特征值为基于所述历史时间窗口内产生的文本数据确定出的表征所述候选词在时间维度上动态变化的特征值;
针对每个候选词,根据所述候选词的第一占比值、预测占比值和波动性特征值,确定所述候选词的波动性得分,所述波动性得分用于表征所述候选词的第一占比值相对于预测占比值的增长率;
根据波动性得分从高到低的排序,选择K个候选词确定出至少一个突发事件;
对确定出的至少一个突发事件进行报警处理;
其中,根据预设数量个历史时间窗口内产生的文本数据,确定所述候选词的预测占比值,具体包括:针对每个历史时间窗口,确定所述候选词在所述历史时间窗口内的第二占比值,所述第二占比值为所述历史时间窗口内包含所述候选词的文本的数量与所述历史时间窗口内的文本总数之比,以及对所述候选词对应的预设数量个第二占比值进行加权平均,得到所述候选词在所述当前时间窗口内的预测占比值,其中,每个第二占比值对应的权重根据其对应的历史时间窗口与所述当前时间窗口之间的时序关系确定;
其中,根据预设数量个历史时间窗口内产生的文本数据,确定所述候选词的波动性特征值,具体包括:计算所述候选词对应的预测占比值和预设数量个第二占比值之间的加权方差值,确定为所述候选词的波动性特征值,其中,每个第二占比值对应的权重根据其对应的历史时间窗口与所述当前时间窗口之间的时序关系确定。
2.根据权利要求1所述的方法,其特征在于,对所述待处理的文本数据进行分词处理,得到若干个候选词,具体包括:
对所述待处理的文本数据进行分词处理,得到若干个分词片段;
根据同义词表,将互为同义词的多个分词片段中的任一分词片段确定为一个候选词,将不存在同义词的分词片段确定为一个候选词。
3.根据权利要求1或2所述的方法,其特征在于,通过以下方式根据K个候选词确定出至少一个突发事件:
沿着分词序列移动第一滑动窗口,并统计K个异常词中任意两个异常词在所述第一滑动窗口内共现的次数,得到共现矩阵,所述分词序列为对所述待处理的文本数据进行分词处理后得到的分词片段组成的序列;
对所述共现矩阵的每一行数据进行归一化处理,得到共现概率矩阵,所述共现概率矩阵中大于概率阈值的共现概率对应的两个异常词相互关联;
根据所述共现概率矩阵,将相互关联的异常词聚类成一个突发事件。
4.根据权利要求3所述的方法,其特征在于,还包括:
针对每个异常词,沿着所述分词序列移动第二滑动窗口,若所述第二滑动窗口中出现所述异常词,则提取所述第二滑动窗口中的分词片段,组成一个候选词组;
针对每个异常词,确定所述异常词对应的各候选词组的熵值,所述熵值等于所述候选词组的左熵值和右熵值中最小的一个值;
针对每个异常词,根据熵值从高到低的排序,选择M个候选词组,确定为所述异常词的摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910708734.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的舆论热点预测方法
- 下一篇:一种资源推荐处理方法及装置