[发明专利]突发事件的监测方法、装置、电子设备及存储介质在审
申请号: | 202111640233.4 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114528396A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 陈建国;陈涛;黄丽达;刘一青;陈杨;史盼盼;王晓萌;刘春慧;赵晨阳;狄文杰;刘连顺;秦阳阳 | 申请(专利权)人: | 北京辰安科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 杜月 |
地址: | 100094 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 突发事件 监测 方法 装置 电子设备 存储 介质 | ||
1.一种突发事件的监测方法,其特征在于,包括:
基于词库中包含的参考词,对网络信息进行遍历,以从中提取包含所述参考词的候选文本;
对所述候选文本进行语义分析,以确定所述候选文本中包含的与突发事件关联的关联文本;
对所述关联文本进行实体提取,以确定所述关联文本对应的第一实体集;
确定所述第一实体集与突发事件数据集中每个突发事件对应的第二实体集之间的第一相似度;
在所述第一实体集与任一第二实体集间的第一相似度大于第一阈值的情况下,确定所述关联文本为所述任一第二实体集对应的第一突发事件的关联文本。
2.根据权利要求1所述的方法,其特征在于,所述对所述关联文本进行实体提取,以确定所述关联文本对应的第一实体集,包括:
从所述参考词库中获取每个事件类型对应的参考词集;
根据每个事件类型对应的参考词集中每个参考词在所述关联文本中的出现次数,及每个所述参考词的权重,确定所述关联文本与每个事件类型间的关联概率值;
根据每个所述关联概率值与每个事件类型对应的第二阈值,确定所述关联文本对应的第一事件类型;
根据位置实体库中包含的位置实体,对所述关联文本进行位置提取,以确定所述关联文本对应的第一地理位置;
基于预设的算法,对所述关联文本进行时间提取,以确定所述关联文本对应的第一发生时间。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一实体集与突发事件数据集中每个第一突发事件对应的第二实体集之间的第一相似度,包括:
确定所述第一事件类型与所述第二实体集中第二事件类型之间的第二相似度、所述第一地理位置与所述第二实体集中第二地理位置之间的第三相似度、所述第一发生时间与所述第二实体集中第二发生时间之间的第四相似度;
根据所述第二相似度、所述第三相似度及所述第四相似度,确定所述第一实体集与所述第二实体集之间的第一相似度。
4.根据权利要求3所述的方法,其特征在于,所述确定所述第一发生时间与所述第二实体集中第二发生时间之间的第四相似度,包括:
根据所述第一发生时间与所述第二发生时间之间的第一时间差,确定所述第四相似度。
5.根据权利要求3所述的方法,其特征在于,在所述确定所述关联文本为所述任一第二实体集对应的第一突发事件的关联文本之后,还包括:
响应于所述第一地理位置的等级高于所述任一第二实体集中的第二地理位置的等级,根据所述第一地理位置,对所述任一第二实体集中的第二地理位置进行更新,以获取更新后的任一第二实体集;
或者,
响应于所述第一发生时间为绝对时间,所述任一第二实体集中的第二发生时间为相对时间,根据所述第一发生时间,对所述任一第二实体集中的第二发生时间进行更新,以获取更新后的任一第二实体集。
6.根据权利要求5所述的方法,其特征在于,在所述获取更新后的任一第二实体集之后,还包括:
确定所述更新后的任一第二实体集与其余每个第二实体集之间的第五相似度;
响应于任一第五相似度大于所述第一阈值,将所述任一第五相似度对应的第二实体集对应的突发事件与所述更新后的任一第二实体集对应的突发事件关联。
7.根据权利要求1-6所述的方法,其特征在于,在所述确定所述第一实体集与突发事件数据集中每个突发事件对应的第二实体集之间的第一相似度之后,还包括:
响应于各个所述第一相似度均小于或等于所述第一阈值,将所述关联文本及所述第一实体集关联存入所述突发事件数据集中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京辰安科技股份有限公司,未经北京辰安科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111640233.4/1.html,转载请声明来源钻瓜专利网。