[发明专利]一种分析用户WiFi活动轨迹规律的分布式实现方法有效

专利信息
申请号: 201611134514.1 申请日: 2016-12-10
公开(公告)号: CN106790468B 公开(公告)日: 2020-06-02
发明(设计)人: 王红 申请(专利权)人: 武汉白虹软件科技有限公司
主分类号: H04L29/08 分类号: H04L29/08;H04W4/02;G06F40/30
代理公司: 上海创开专利代理事务所(普通合伙) 31374 代理人: 吴海燕
地址: 430200 湖北省武汉*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 分析 用户 wifi 活动 轨迹 规律 分布式 实现 方法
【权利要求书】:

1.一种分析用户WiFi活动轨迹规律的分布式实现方法,其特征在于,包括以下步骤:

(a)轨迹提取:后台服务器查询模块查询后台服务器数据库中的用户移动端MAC地址所对应的WiFi扫描记录,所述WiFi扫描记录为由多台WiFi采集设备采集记录并由所述WiFi采集设备上传至所述后台服务器数据库;

将所述WiFi扫描记录按采集时间进行排序获得WiFi扫描轨迹E={e1,e2,…,en},其中ei=pi,ti,i为自然数,ei表示轨迹点,pi表示地理位置,ti表示扫描时间;

(b)轨迹点预处理:后台服务器的数据处理模块依次遍历WiFi扫描轨迹E,对任意连续的两个轨迹点记录ei和ei+1,如果pi=pi+1且ti+1-ti<Δt,则将所述ei和ei+1两条记录合并为一个复合轨迹点记录ei’=pi,tiin,tiout,其中,tiin=ti,tiout=ti+1;由合并后的复合轨迹点记录ei’组成WiFi扫描轨迹E’={e1’,e2’,…,en’},其中ei’=pi,tiin,tiout,n为自然数,pi表示地理位置,tiin表示ei’采集开始时间,tiout表示ei’采集结束时间;

(c)轨迹片段划分:根据预定规则对步骤(b)中获得的WiFi扫描轨迹E’进行分割,获得只包含有序位置轨迹点位置的多条轨迹片段,并由所述多条轨迹片段得到轨迹集合TR;

(d)频繁轨迹提取:采用并行算法计算步骤(b)中获取的轨迹集合TR中的轨迹点pi出现频率次数,得到频繁轨迹点,进而使用并行后缀树算法实现频繁轨迹提取;

(e)建立语义化模型:对频繁轨迹产生时间的星期和小时进行语义化定义;

(f)建立轨迹语义化:获取频繁轨迹的时间尺度频率次数中次数最多的星期和小时,根据语义化模型将轨迹路径进行分类,获取频繁轨迹的语义化模型;

所述预定规则包括规则一和规则二:

规则一:如果一个轨迹点pi,tiin,tiout的停留时间τi=tiout-tiinΔt,则将轨迹在pi处进行分割,且将地理位置点pi作为上一段轨迹片段的终点和下一段轨迹片段的起点;

规则二:如果两个轨迹点pi,tiin,tiout和pi+1,ti+1in,ti+1out的间隔时间τi’=ti+1in-tiout>Δt,则将轨迹在pi处进行分割,其中pi作为上一段轨迹片段的终点,pi+1作为下一段轨迹片段的起点;

根据规则一或规则二对WiFi扫描轨迹E’进行分割后获得轨迹集合TR={TR1,TR2,…,TRn},其中第i条轨迹片段TRi={pi1,pi2,…,pim},pim表示第i条轨迹片段中的用户移动端经过的第m项轨迹点位置,pim对应WiFi采集设备地理位置;

所述频繁轨迹提取包括以下步骤:

步骤一,对步骤(b)中的每个项pim对应的WiFi采集设备地理位置PI在TR中出现的频率次数进行计数,然后将WiFi采集设备PI出现频率次数进行降序排序,并从TR中过滤出WiFi采集设备PI出现频率次数大于最小支持度的项作为频繁轨迹点;

步骤二:采用均衡分组算法将步骤1中获得的对应频繁轨迹点均匀地划分到Q个分组中,平衡所有组内的计算负载,其中Q为大于1的自然数;

步骤三:获得每条轨迹片段TRi的后缀模式,所述轨迹片段TRi的后缀{pi1,pi2,…,pim}包括多种组成模式,所述组成模式为将轨迹片段TRi中所有的有序轨迹点位置任意分成两部分然后由后一部分有序轨迹点位置组成,一种所述组成模式为所述轨迹片段TRi的一种后缀模式;根据后缀模式中第一项是否为频繁轨迹点来判断所述后缀模式的分组,其中,若后缀模式中第一项为频繁轨迹点,则将所述后缀模式归属到其第一项对应的频繁轨迹点所在的分组;若后缀模式中第一项不是频繁轨迹点,则该后缀模式被自动过滤不进入任意分组中;

步骤四:对每个分组构建一个后缀树,获得Q个后缀树,由Q个后缀树构造并行后缀树,对并行后缀树进行并行处理;后缀树的创建为首先建立树的根节点,然后扫描同一个分组内的所有TRi的后缀模式,并对每个后缀模式创建分枝,所述后缀模式中任意轨迹点位置pim为所述后缀模式分枝的节点,将所有的后缀模式分枝连接到根节点,获得每个分组的后缀树,并对所述后缀树进行压缩处理;

步骤五:对后缀树每个后缀树模式分枝内有序的各节点依次计数,通过节点的计数与最小支持度的比较确定频繁轨迹片段,即若某一节点的计数小于最小支持度则停止对所述后缀树模式分枝内后续节点的计数且所述计数小于最小支持度时的节点前面所有节点组合形成一条频繁轨迹片段;或者若所述后缀模式分枝所有节点的计数均满足大于等于最小支持度则所述后缀模式分枝为频繁轨迹片段,由频繁轨迹片段组成频繁轨迹。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉白虹软件科技有限公司,未经武汉白虹软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611134514.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top