[发明专利]面向网络流式数据的事件实时过滤方法和系统有效
申请号: | 201310136896.1 | 申请日: | 2013-04-19 |
公开(公告)号: | CN103198146A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 程学旗;刘盛华;邱文一;王元卓;刘悦;莫溢;黄展坤 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 网络 数据 事件 实时 过滤 方法 系统 | ||
1.一种面向网络流式数据的事件实时过滤方法,所述方法包括:
步骤1)响应于加载事件规则的请求来加载事件规则,所述事件规则包括过滤规则列表和信息源范围;
步骤2)根据所加载的事件规则对网络流式数据进行过滤。
2.根据权利要求1所述的方法,所述步骤1)包括:
步骤11)响应于加载事件规则的请求读取相应的事件规则;
步骤12)根据从所述事件规则中提取的所有关键词构建trie树。
3.根据权利要求2所述的方法,所述步骤2)包括:
步骤2-1)基于所构建的trie树对网络流式数据进行过滤,获取包含所述关键词的文档;
步骤2-2)基于所述过滤规则列表从包含所述关键词的文档中提取出符合全部过滤规则的文档;
步骤2-3)从所述符合全部过滤规则的文档中提取符合所述信息源范围的文档。
4.根据权利要求3所述的方法,所述步骤2)还包括:
步骤2-4)对经步骤2-3)得到的符合所述信息源范围的文档进行打分的步骤,每个文档的分值weight以如下方式计算:
其中e是自然常数,n是该文档中包含的关键词的总数,i代表是该文档中包含的第i个关键词的序号,xi是该第i个关键词在该文档中的命中次数,wi是该第i个关键词的权重。
5.根据权利要求1所述的方法,所述步骤1)包括:
(1)接收加载事件规则的请求;
(2)判断目前是否存在正在被用于建Trie树的事件规则;
(3)如果存在,则备份事件规则,如果之前有已经备份的事件规则,则覆盖;如果不存在直接建立并保存临时Trie树;
(4)判断全局Trie树是否存在并且被使用;如果不存在或者没有被使用则使用该新建的临时Trie树来更新全局Trie树;否则等待全局Trie 树使用完毕之后再更新全局Trie树;
(5)判断是否有备份的事件规则,如果有,则返回(2)继续执行,如果没有,则结束。
6.根据权利要求5所述的方法,所述步骤2)包括:
步骤b1,读取一组文档并将其封装成文本序列;
步骤b2:判断Trie树是否建立完毕,如果全局Trie树已经建好则进行下一步,否则等待一秒;
步骤b3:利用全局Trie树对所组织的文本序列进行关键词匹配;
步骤b4:基于该所加载的事件规则中的过滤规则对步骤b3扫描全局trie树得到的匹配结果进行解析,以得到符合过滤规则列表中所有过滤规则的文档;
步骤b5:过滤掉不在事件规则要求的信息源范围之中的文档;
步骤b6:输出并保存过滤结果,并返回步骤b1。
7.一种面向网络流式数据的事件实时过滤系统,所述系统包括:
事件规则加载装置,用于响应于加载事件规则的请求来加载事件规则,所述事件规则包括过滤规则列表和信息源范围;
过滤装置,用于根据所加载的事件规则对网络流式数据进行过滤。
8.根据权利要求7所述的系统,所述事件规则加载装置被配置为执行:
(1)接收加载事件规则的请求;
(2)判断目前是否存在正在被用于建Trie树的事件规则;
(3)如果存在,则备份事件规则,如果之前有已经备份的事件规则,则覆盖;如果不存在直接建立并保存临时Trie树;
(4)判断全局Trie树是否存在并且被使用;如果不存在或者没有被使用则使用该新建的临时Trie树来更新全局Trie树;否则等待全局Trie树使用完毕之后再更新全局Trie树;
(5)判断是否有备份的事件规则,如果有,则返回(2)继续执行,如果没有,则结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310136896.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置及可显示多灰阶的显示方法
- 下一篇:彩色滤光片
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置