[发明专利]互联网实时计算的方法和系统有效
申请号: | 201210369816.2 | 申请日: | 2012-09-27 |
公开(公告)号: | CN102902775A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | 何跃;汤晓刚 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L12/24;H04L29/08 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 黄启行;方晓明 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互联网 实时 计算 方法 系统 | ||
1.一种互联网实时计算方法,包括:
根据用户在网站上的操作,前端服务器生成指定格式的消息日志并发送所生成的指定格式的消息日志;
中心消息日志收发处理单元接收所述前端服务器发送的消息日志,并根据消息日志的属性,分发消息日志到后端的相应的实时计算模型单元中;
所述实时计算模型单元对接收到的消息日志进行预定的计算,把计算结果放在内存或者磁盘中,或将结果作为API供其他程序调用。
2.如权利要求1所述的方法,其特征在于,所述指定格式的消息日志包含了所述实时计算模型单元所需要的元数据,所述元数据具体为用户的UID、或操作时间、或操作类型、或文章内容等。
3.如权利要求1所述的方法,其特征在于,所述实时计算模型单元为实时活跃用户分析模型。
4.如权利要求1所述的方法,其特征在于,所述实时计算模型单元为实时热点排行模型单元;以及
所述实时计算模型单元对接收到的消息日志进行预定的计算具体为:
所述实时热点排行模型,采用实时热点排行榜算法,所述算法采用时间片分割方法,把时间分为各个长度的自然时间段,多维度反应当前数据的热点排行。
5.如权利要求4所述的方法,其特征在于,所述实时热点排行榜算法为TF/IDF、隐马尔可夫链、决策树、贝叶斯算法中的一种或几种。
6.如权利要求1所述的方法,其特征在于,所述实时计算模型单元为实时反垃圾模型单元;或者所述实时计算模型单元为实时非法信息过滤模型单元。
7.如权利要求1所述的方法,其特征在于,所述中心消息日志收发处理单元以预定速度收集和分发消息日志到所述的实时计算模型单元。
8.一种互联网实时计算系统,该系统包括:
前端服务器,用于根据用户在网站上的操作,生成指定格式的消息日志,并将生成的指定格式的消息日志进行发送;
中心消息日志收发处理单元,用于接收所述前端服务器发送的消息日志,并根据消息日志的属性,分发消息日志到后端相应的实时计算模型单元中;
所述实时计算模型单元用于对接收到的消息日志进行预定的计算,把计算结果放在内存或者磁盘中,或将结果作为API供其他程序调用。
9.如权利要求8所述的系统,其特征在于,所述实时计算模型单元为实时热点排行模型;以及
所述实时计算模型单元对接收到的消息日志进行预定的计算具体为:
所述实时热点排行模型,采用实时热点排行榜算法,所述算法采用时间片分割方法,把时间分为各个长度的自然时间段,多维度反应当前数据的热点排行。
10.如权利要求8所述的系统,其特征在于,所述前端服务器为多个;以及
所述实时计算模型单元具体为实时活跃用户分析模型单元、实时热点排行模型单元、实时反垃圾模型单元或者实时非法信息过滤模型单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210369816.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:清洗装置
- 下一篇:一种改进型高压脉冲清洁喷头