[发明专利]网站流量异常确定方法及装置有效
申请号: | 201611220164.0 | 申请日: | 2016-12-26 |
公开(公告)号: | CN108243037B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 祁建娟 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/06 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 流量 异常 确定 方法 装置 | ||
本发明实施例提供了一种网站流量异常确定方法及装置,可以提取分析指标信息,计算得到提取的分析指标信息的信息熵,根据计算得到的信息熵是否位于预设的正常网站流量的信息熵范围内确定网站流量是否为异常网站流量。可见,本发明实现了异常网站流量的确定,同时,本发明的方案不需要维护大量的训练样本,因此节省了时间成本和人力成本。
技术领域
本发明涉及互联网技术领域,尤其涉及网站流量异常确定方法及装置。
背景技术
网站流量(traffic)是指网站的访问量,可以用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标。在获得网站流量后,可以对其进行分析、统计,从中发现用户访问网站的规律,并将这些规律与网络营销策略等相结合,从而发现网络活动中可能存在的问题,并为进一步修正或重新制定网络方式提供依据。
但网站流量中可能存在异常的网站流量,例如:一些人通过互刷软件、广告联盟等方式来提高网站流量,这种情况下产生的网站流量属于异常的网站流量。如果不将这种情况下产生的异常网站流量识别出来,就会降低后续对网站流量的进行分析、统计的准确性。
因此,如何确定异常的网站流量仍旧是一个本领域亟待解决的技术难题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种网站流量异常确定方法及装置,方案如下:
一种网站流量异常确定方法,包括:
获取待确定的网站流量对应的分析指标信息;
根据预设的正常网站流量的信息熵范围,确定待提取的分析指标信息;
提取所述待提取的分析指标信息,计算得到提取的分析指标信息的信息熵;
判断计算得到所述提取的分析指标信息的信息熵是否位于所述信息熵范围内,如果是,则确定待确定的网站流量为正常网站流量;否则,确定待确定的网站流量为异常网站流量。
可选的,在获取待确定的网站流量对应的分析指标信息前,所述方法还包括:
获取预设历史时间段内的正常网站流量对应的分析指标信息;
从所述正常网站流量对应的分析指标信息中提取预设的至少一种分析指标信息,计算得到提取的所述至少一种分析指标信息的信息熵;
根据计算得到的所述至少一种分析指标信息的信息熵确定正常网站流量的信息熵范围,将确定的正常网站流量的信息熵范围作为所述预设的正常网站流量的信息熵范围。
可选的,所述从所述正常网站流量对应的分析指标信息中提取预设的至少一种分析指标信息,计算得到提取的所述至少一种分析指标信息的信息熵,包括:从所述正常网站流量对应的分析指标信息中提取预设的多种分析指标信息,计算从所述预设历史时间段内的每一个子时间段内提取的各种分析指标信息的信息熵;
所述根据计算得到的所述至少一种分析指标信息的信息熵确定正常网站流量的信息熵范围,包括:
对计算得到的每一个子时间段内的各种分析指标信息的信息熵均进行加权求和/加权平均,得到每一个子时间段对应的信息熵,根据每一个子时间段对应的信息熵确定正常网站流量的信息熵范围。
可选的,所述根据预设的正常网站流量的信息熵范围,确定待提取的分析指标信息,包括:
将与所述预设的正常网站流量的信息熵范围对应的多种分析指标信息确定为待提取的分析指标信息;
所述提取所述待提取的分析指标信息,计算得到提取的分析指标信息的信息熵,包括:
确定与所述预设的正常网站流量的信息熵范围对应的子时间段匹配的统计周期;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611220164.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:DCN报文处理方法、网络设备和网络系统
- 下一篇:一种服务调用的方法和装置