[发明专利]时空同现的挖掘方法、服务器及计算机可读存储介质在审
申请号: | 201711191199.0 | 申请日: | 2017-11-24 |
公开(公告)号: | CN108197140A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 李慧波;杨云祥;郭静;吉祥;宋超;唐先超;胡罡;连礼泉 | 申请(专利权)人: | 中国电子科技集团公司电子科学研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 于金平 |
地址: | 100041 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时空 计算机可读存储介质 挖掘 服务器 出行方式 模式挖掘 时间数据 时间维度 字段数据 私家车 大巴 卡口 复合 航班 列车 通行 | ||
1.一种时空同现的挖掘方法,其特征在于,包括:
选取总数据表的有效记录中的某人xi,对其每一个目的地Di,进行以下操作:
步骤a.从总数据表中找出xi去往Di的第i条“通过卡口代码集合”,记为xi_kakou_i;
步骤b.从总数据表中找出与xi去往同目的地Di的所有姓名集合,记为Y={y1,y2,…,yn};
步骤c.对集合Y中的第i个人yi,从总数据表中找到其第j条“通过卡口代码集合”,记为yi_kakou_j;
步骤d.如果xi_kakou_i集合不为空,对xi_kakou_i与yi_kakou_j取交集,其交集个数如果大于通过卡口集合xi_kakou_i个数的预定阈值数量,则判定该记录在指定时间段内产生时空同现关系,将轨迹重复次数S加1,否则重复上个步骤c;
步骤e.判断轨迹重复次数S,若其小于预设的阈值次数M,则读取集合Y中的下个记录yj,重复步骤c,若大于预设的阈值次数M,则中断该循环,将姓名yj及其相关卡口、航班信息写入xi的结果嵌套表中,重复步骤a;
以上步骤遍历完毕后,对总数据表中其他所有有效记录中的人重复执行上述步骤,形成了结果数据表。
2.根据权利要求1所述的方法,其特征在于,
所述总数据表为共同存在于所述第一数据表和第二数据表的姓名或身份证号、航班号或车次、目的地、通过卡口代码集合的字段;
其中,所述第一数据表包括从公共交通中的交通出行信息中,抽取姓名或身份证号、航班号或车次、目的地、出发时间的字段信息,所述第二数据表从预设的卡口数据中的交通出行信息中,抽取姓名或身份证号、通过卡口代码、通行时间的字段信息。
3.根据权利要求2所述的方法,其特征在于,还包括:
创建所述总数据表。
4.根据权利要求3所述的方法,其特征在于,所述创建所述总数据表,具体包括:
从所述第一数据表中选取一个有效记录,根据该有效记录的出发时间,选取所述第二数据表中卡口通行时间处于该出发时间前预定时间段内的卡口代码集合,记录与代码集合共同存入初始化后的总数据集合,并重复执行上述步骤,得到所述总数据表。
5.根据权利要求1所述的方法,其特征在于,
所述结果数据表包括与预设记录人员同行的所有人员,及各个人员的出行记录。
6.一种服务器,其特征在于,所述服务器包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的计算机指令,以实现权利要求1至5中任一项所述的时空同现的挖掘方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至5中的任一项所述的时空同现的挖掘方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司电子科学研究院,未经中国电子科技集团公司电子科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711191199.0/1.html,转载请声明来源钻瓜专利网。