[发明专利]差分账户的归类方法及系统、服务终端、存储器有效
申请号: | 201710759353.3 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107515937B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 万景琨 | 申请(专利权)人: | 千寻位置网络有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2455;G06F16/26 |
代理公司: | 上海市海华永泰律师事务所 31302 | 代理人: | 包文超 |
地址: | 200433 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 账户 归类 方法 系统 服务 终端 存储器 | ||
一种差分账户的归类方法及系统、服务终端、存储器,所述归类方法包括:分别将每一差分账号的用户行为转化为一组特征向量,所述一组特征向量对应一个差分账号,所述一组特征向量包括多维特征向量;基于所转化的特征向量构造哈希函数族,所述哈希函数族包括两组以上哈希函数,每一组哈希函数对应一个差分账号;基于所构造的哈希函数族对所述差分账号进行归类。本发明中,将用户行为转为特征向量,并映射到哈希函数族中,然后进行用户行为分析,可有效地提高数据分析的效率。
技术领域
本发明属于互联网技术领域,尤其涉及一种差分账户的归类方法及系统、服务终端、存储器。
背景技术
随着信息技术和网络技术的不断发展,互联网上的信息和资源出现了爆炸性的增长。例如普通差分账户几乎每天产生海量的关于行为应用的数据,而如何从庞大的差分用户数据中挖掘出有用的信息是一个难题。而上述海量数据中,由于数据格式各异、没有统一规范的描述方法,因而难以同步化;此外数据信息的更新速度非常快,如何有效地利用这些海量数据资源,并且全方位且深层次地实现资源共享,使数据发挥出最大的效益时迫切需要解决的问题。
现有技术的差分数据分析方法,往往局限于操作方式及操作对象的分析,而操作方式及操作对象的关联松散,导致工作繁琐且工作量巨大,分析挖掘效率较低,浪费了大量的人力。
发明内容
本发明实施例提供了一种差分账户的归类方法及系统、服务终端、存储器,旨在解决现有技术中数据分析挖掘的效率较低的问题。
本发明实施例是这样实现的,一种差分账户的归类方法,包括:
分别将每一差分账号的用户行为转化为一组特征向量,所述一组特征向量对应一个差分账号,所述一组特征向量包括多维特征向量;
基于所转化的特征向量构造哈希函数族,所述哈希函数族包括两组以上哈希函数,每一组哈希函数对应一个差分账号;
基于所构造的哈希函数族对所述差分账号进行归类。
优选地,所述基于所转化的特征向量构造哈希函数族具体包括:
分别基于每一组特征向量构造对应的一组哈希函数;
将构造的每一组哈希函数组成所述哈希函数族。
优选地,所述基于所构造的哈希函数族对所述差分账号进行归类具体包括:
基于所构造的哈希函数族,构造对应的整型向量;
构造二维哈希空间;
基于所述整型向量及二维哈希空间对所述差分账号进行归类。
优选地,所述基于所构造的哈希函数族,构造对应的整型向量具体为:
基于所述哈希函数族构造哈希函数组;
将所述哈希函数组映射成整型向量。
优选地,所述构造二维哈希空间具体包括:
设定第一哈希函数及第二哈希函数;
基于所述整型向量、所述第一哈希函数及第二哈希函数获取两组以上二元组值。
优选地,所述基于所述整型向量及二维哈希空间对所述差分账号进行分类具体包括:
分析所述两组以上二元组值的任意两组二元组值;
当有两组二元组值相等时,确认二元组值相等对应差分账号为同一类差分账号。
优选地,所述第一哈希函数及第二哈希函数分别为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于千寻位置网络有限公司,未经千寻位置网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710759353.3/2.html,转载请声明来源钻瓜专利网。