[发明专利]识别基于DBSCAN模型的非正常批量购票行为的方法在审
申请号: | 201611019839.5 | 申请日: | 2016-11-18 |
公开(公告)号: | CN106657007A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 曹杰;冯雨晖;宿晓坤;杨睿;李学超 | 申请(专利权)人: | 北京红马传媒文化发展有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/26;G06Q30/06 |
代理公司: | 北京天奇智新知识产权代理有限公司11340 | 代理人: | 杨文录 |
地址: | 100027 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 基于 dbscan 模型 正常 批量 购票 行为 方法 | ||
1.一种识别基于DBSCAN模型的非正常批量购票行为的方法,其特征在于,包括:
监测预定时间段内的注册数量高于参考时间段的注册数量的识别阈值后,获取基于密度聚类算法扫描所述预识别时间段内的所有注册行为后标记的至少一个高度集中的注册账户簇;
将所述标记的至少一个高度集中的注册账户簇的网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;
提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;
识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。
2.如权利要求1所述的方法,其特征在于,所述将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识,包括:
通过哈希函数将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
3.如权利要求1或2所述的方法,其特征在于,所述识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离,包括:
识别所述网络购票行为属性中的频次阀值和黑名单,所述频次阀值包括但不限于:不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
通过所述频次阀值和黑名单识别出异常行为的用户IP,将所述识别出的用户IP存入黑名单进行隔离。
4.如权利要求1-3之一所述的方法,其特征在于,所述提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性,包括:
提取所述用户标识中的历史行为记录中的历史频次阀值和历史黑名单;
提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值和超出购买行为异常阀值的异常注册用户的黑名单;
实时采集用户标识的当前访问行为记录中的当前用户访问频次和路径。
5.如权利要求4所述的方法,其特征在于,所述提取所述用户标识中的历史行为记录中的历史频次阀值,包括以下步骤:
将历史行为记录中的日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在数据表中,计算访问频次,并将计算结果存入大数据数仓中;所述访问频次包括但不限于不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
使用直方图,观察频次分布,自定义确定历史频次阀值并存储所述历史频次阀值。
6.如权利要求4所述的方法,其特征在于,所述提取所述用户标识中的历史行为记录中的历史黑名单,包括以下步骤:
将ngnix代理服务器集群中不同的服务器上的前一天的用户访问日志文件集中到分布式存储系统HDFS上;
将日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在Hive中,计算不同IP访问频次,每个IP的访问不同url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问不同url的频次;将计算结果存入大数据数仓中;使用直方图,观察频次分布,自定义确定历史频次阀值;
基于确定的历史频次阀值和频次计算结果,识别出异常的客户,存入到黑名单表中。
7.如权利要求4所述的方法,其特征在于,所述提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值,包括以下步骤:
导入历史交易行为记录到数据仓库中;
计算每个用户IP的单场次购票数,购买项目数,平均购票数;
使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值,并存储所述存在潜在的购买行为异常阀值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京红马传媒文化发展有限公司,未经北京红马传媒文化发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611019839.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软件信息的安全防护方法和装置
- 下一篇:一种用户上网行为研究方法