[发明专利]一种大数据环境下一人多卡识别方法有效
申请号: | 202011142356.0 | 申请日: | 2020-10-23 |
公开(公告)号: | CN111970685B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 张颖;顾高翔;刘杰 | 申请(专利权)人: | 上海世脉信息科技有限公司 |
主分类号: | H04W8/18 | 分类号: | H04W8/18;H04W8/24;G06F16/909 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201210 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 环境 下一人多卡 识别 方法 | ||
1.一种大数据环境下一人多卡识别方法,其特征在于,包括以下步骤:
步骤1、从传感器运营商获取EPID编号唯一的匿名加密移动终端传感器数据,提取指定时间段内所触发的通信信令记录,对其记录的样点按等时间间隔进行扩充,获得其出行时空轨迹;
步骤2、从出行时空轨迹中截取大量等时间间隔的个体轨迹片段,构建比较向量一致性指标,计算固定时间段内固定时间间隔下随机选取的出行轨迹的一致性指标,获得判定两条轨迹是否一致的一致性检验指标;
步骤3、从数据库选定一个移动通信卡号作为待匹配对象,获取其出行时空序列,遍历移动通信记录数据库,从中选取其他个体出行时空序列与其进行匹配,在时空序列中随机截取相同点位的序列片段,计算两条时空序列的空间位置上的相关性,对其进行一致性检验,判断其是否为同一人持有;
步骤4、遍历整个数据库后获取所有已判定与初始选定移动通信卡号为同一人持有的其他卡号,将其标注为同一人持有,为其标识个体编号PID,针对数据库中的每一组个体出行时空序列,均以遍历数据库的方式将其与所有其他个体的出行时空序列进行匹配,判别其是否为同一人持有,若出现一个卡号为多个人同时持有的情况,即某一卡号与两个相互不匹配的卡号的相似性均能通过检验,则将其归于相似度更大的移动通信卡;
步骤5、在遍历完数据库,为所有移动通信卡号均进行了出行时空序列匹配后,判断其是否与其他卡号存在为一人持有的情况,针对每一组一人多卡记录,查询其多个卡号与固定传感器的通信记录,将卡号改为个体标识PID,依据时间顺序将多条出行时空序列相互内插为一条移动通信记录集,将新的记录集作为手持移动通信卡与固定传感器的通信记录存入数据库并进行等时间间距的时空加权插值,获取更加精细的个体出行时空序列。
2.如权利要求1所述的一种大数据环境下一人多卡识别方法,其特征在于,所述步骤1根据移动通信卡的唯一编号EPID,查询其在指定时间段内所有的通讯记录,初步构建由个体通过单一移动通信卡号和固定传感器通信记录构成的个体出行时空轨迹,采用时空加权插值法,对每条个体出行时空轨迹进行等时间间距的空间插值,获得等时间间隔的个体出行时空序列,删除原始的移动通信卡与固定传感器之间的通信记录,完全以插值得到的个体出行时空序列代表个体在时空上的移动,构建个体在指定时间段T内等时间间隔Th的出行时空序列,序列中包含T/Th+1个节点,每个节点均包含了时间和XY坐标信息。
3.如权利要求1所述的一种大数据环境下一人多卡识别方法,其特征在于,所述步骤2基于个体出行时空序列,构建时空序列一致性比对指标矩阵M,M为2×n×m×3阶矩阵,2表示其区分同网异网两种情况;n为按一天24小时划分出来的时间段数量;m表示每个时间段内采样节点数量情况;3表示每个时间段内每种采样节点数量的三个一致性判别标准,分别代表95%、99%和99.9%置信,遍历M矩阵,单次提取其两两出行时空序列片段之间基于皮尔逊积矩值及相似性所构建的一致性指标;统计N对时空序列样本得到的 的平均值,并设置, , 共3个级别的一致性指标从不同层次对时空序列的相似性进行约束,即其一致性在95%,99%和99.9%水平上显著,令其分别为 、、。
4.如权利要求1所述的一种大数据环境下一人多卡识别方法,其特征在于,所述步骤3对目标卡号获取随机时间段内的出行时空序列,将其与数据库中每个卡号的同时间段序列进行对比:若一致性指标大于,舍弃该出行时空序列;若一致性指标小于等于,则不断随机截取两条出行时间序列上相同点位的片段,计算其一致性指标,直至该出行时空序列被舍弃或判定两条出行时空序列代表同一人出行的轨迹。
5.如权利要求4所述的一种大数据环境下一人多卡识别方法,其特征在于,所述步骤3针对 、 和这三个置信区间,设定这两组出行时空序列C1和Ci为同一人出行轨迹的抽样数判别阈值及一致性对比结果在这三个置信区间内的抽样数量,当一致性指标大于该时间段的一致性比对指标,舍弃该出行时空序列,否则在任意置信区间内满足一致性指标的抽样数大于等于抽样数判别阈值,则判定判断为同一人所有的两条出行时空序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海世脉信息科技有限公司,未经上海世脉信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011142356.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置