[发明专利]一种基于区域和对象信息发现的事件预警方法有效

专利信息
申请号: 201210501970.0 申请日: 2012-11-29
公开(公告)号: CN103853700A 公开(公告)日: 2014-06-11
发明(设计)人: 杨风雷;黎建辉 申请(专利权)人: 中国科学院计算机网络信息中心
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 北京君尚知识产权代理事务所(普通合伙) 11200 代理人: 余长江
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 区域 对象 信息 发现 事件 预警 方法
【说明书】:

技术领域

发明属于信息技术领域,尤其涉及一种对爬取得到的互联网信息进行特定处理,在对事件发生的区域、对象种类等进行信息发现的基础上进行事件预警的方法,主要应用于食品安全事件信息监控、风险预警等非常规突发事件的应急处理工作中。

背景技术

近年来,食品安全事件诸如毒胶囊、回锅油、瘦肉精、染色馒头、塑化剂、毒黄瓜等频频发生,这既造成了极坏的社会影响,也带来了大量的经济损失。为了避免或最大限度的降低这些食品安全事件所带来的危害,基于事件的风险预警技术开始得到了极大关注。为进行基于事件的风险预警,这就需要提前发现这些事件的信息。

随着Internet的迅猛发展,互联网网民数量越来越庞大,互联网逐渐成为网民发布信息、获取信息和传递信息的主要载体,而且通过人、组织等之间的交互形成了一个和现实社会有一定的对应、关联关系的虚拟社会。它已经变成了世界上规模最大的公共数据源,而且其规模还正在不停的增长着。此状况下,利用互联网自身的特点,建立起完善的社会信息反馈网络,提前发现各种可能带来危机的“未然”因素,为食品安全事件的应急管理提供及时、准确、全面的信息就显得势在必行和有着非常重要的意义。

为利用互联网上的信息进行食品安全事件的风险预警,需要经过一定的过程得到事件相关的信息。这首先需要进行互联网信息爬取,之后即可进行食品安全事件相关的信息提取、发现工作,待发展到一定程度后即可进行预警。在这样一个过程里面,其中的关键步骤是进行事件信息的识别,理论上这可以通过各种有监督的机器学习或者无监督的机器学习方法实现,但结合实际的信息需求和准确度、可操作性等的考虑,往往采取一些变通的措施。比如有研究工作采取的方式是:事先建立一些信息分类(比如疾病),针对每个分类收集一些关键词,之后对收集到的网页信息以这些分类和关键词为基础,采取关键词匹配的方式进行信息分类,并在此基础上监控类别信息即事件的发展。也有研究工作采用了信息的相关性检测、命名实体识别、利用疾病和地址的信息提取、可视化的展示结果等步骤进行事件信息的识别和判断的做法。

从评估试验的结果看,上述做法中事件信息的判断、识别、预警等还存在性能上的不足(准确率、召回率等参数有待进一步提高)。对此,如果考虑到上述方法中未考虑信息中存在的各种垃圾信息的影响、截止目前信息提取技术的准确度尚未足够高、及直接将经过关键词匹配后得到的类别信息作为同一种事件信息的做法中可能存在信息对应的主体不一致等问题,上述方法存在性能上的不足也就不足为奇了。

发明内容

为解决上述的问题,本发明的目的在于提供一种采取特定步骤对网页信息的内容进行分析,从中提取事件的发生区域、对象种类等要素以识别所发生的事件,之后根据事件的发展趋势进行预警的方法。方法中借鉴智能系统思路,形成的步骤如下所述。

1、建立本体

依据食品安全事件的特点和后期信息分析的需要,从对象、区域、结果、关联者、时间等纬度建立食品安全事件信息本体。从而为食品安全事件的信息过滤、信息发现等提供了基础。

2、信息过滤

在上述建立的本体基础上,对爬取得到的网页信息进行过滤。过滤过程主要分为两个部分:食品安全信息过滤、垃圾信息过滤。其中前者主要是通过对信息的标题、内容等采取模式匹配的方法确定其是否属于食品安全信息;后者主要是对通过内容、链接作弊的垃圾信息、以及用户生成内容中的无关意见、低质量意见和欺骗性垃圾意见通过建立的检测模型进行过滤。从而保证进入后续过程的信息的质量。

3、区域信息发现

在上述建立的区域信息本体基础上,对爬取、过滤后的信息的标题、内容等进行地名代词等解析后,采取模式匹配、基于机器学习判断模型的判断识别方法进行信息相关区域的发现确定。

4、对象信息发现

基于事先建立的回归分析模型,对信息的标题、内容等进行分词、降维等步骤后针对各对象类别(事先设定,比如蔬菜)进行回归分析,以此确定网页信息是否和目标对象有关系。从而发现信息相关的对象种类等。由此,结合区域信息、对象种类信息等,即可相对准确的确定发生的事件。

5、趋势追踪、预警及展示

经过信息过滤、区域信息发现、对象信息发现后,在建立表示事件的特征参数诸如页面数、页面浏览数、综合指数等的基础上,通过定期计算事件特征参数值的方法对事件的发展趋势进行追踪;并对事件当前的各特征参数值和其之前一定时期内的均值进行比较,如果差值为正且绝对值持续大于一定的阈值,则进行事件预警;之后将预警分析的结果展示给相关的用户和为用户服务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210501970.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top