[发明专利]一种大数据环境下一人多卡识别方法有效
申请号: | 202011142356.0 | 申请日: | 2020-10-23 |
公开(公告)号: | CN111970685B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 张颖;顾高翔;刘杰 | 申请(专利权)人: | 上海世脉信息科技有限公司 |
主分类号: | H04W8/18 | 分类号: | H04W8/18;H04W8/24;G06F16/909 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201210 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 环境 下一人多卡 识别 方法 | ||
本发明提供了一种大数据环境下一人多卡识别方法。本发明充分利用现有的海量手持移动通信设备与固定传感器间的通信记录,设计比对算法和一致性检验标准,不仅能低成本、自动化、便捷地对目标数据进行整理,识别出其中隶属一人的多个卡号,有效地从大量通信记录中提取出空间中的实际个体,降低一人多卡对总体统计的影响,还能通过多个卡号的时空轨迹融合,更加精确地获取个体的出行时空序列,从而为其他空间大数据分析提供更加可靠的数据基础。
技术领域
本发明涉及一种基于海量移动通信数据的一人持有多卡状态的识别方法,属于大数据分析技术领域。
背景技术
近年来,随着信息技术的发展,数据信息量呈现爆炸式增长,数据来源越来越多,数据量也越来越庞大。其中,由手机、WIFI、物联网等信息传感器记录的数据已经成为大数据分析中最重要的数据来源,其较为完备的个体出行记录为大数据,尤其是交通大数据分析提供了很好的数据支持。
采用传感器通信数据进行城市社会经济方面的研究和分析,固然可以更加精准地将研究细化到城市中活动的个体,但是其样本分布仍然与现实分布存在较大的偏差,使得其本身的有偏性对分析结果带来严重影响。其中,一人多卡现象的存在就对采用移动通信大数据的研究工作带来了极大的困扰。一人多卡指的是同一人在同一或不同移动通信运营商下办理了多个卡号。当前,高中低端手机搭配使用和双卡双待手机的热销表明一人持有双卡,乃至多卡现象的普遍性,若不对这一现象进行处理,则在分析城市人群时空移动过程中会产生大量冗余时空轨迹,造成分析结果的偏差。2019年10月,国内三家运营商移动、联通、电信,活跃用户数量分别为9.4359亿、3.22119亿、3.3253亿,共计15.982亿手机用户,2018年末全国人口数量不过13.9538亿,人均手机卡号数量达到1.145,同网多卡和异网多卡已经达到相当高的程度。但是,对一人多卡现象的识别存在难度,因为每个卡号都会独立地与基站、WIFI等固定传感器进行通信,这使得即便是同一个移动通信网络,两张卡与固定传感器的通信记录组成的时空轨迹之间也会存在差异,而异网卡号之间更是存在固定传感器自身位置差异,使得一人多卡现象更难被识别,也缺乏判定的标准。因此,我们需要在数据预处理阶段采用一定的算法,计算出一套判断一人多卡现象的指标体系,识别出同一人持有的多个移动通信卡号的方法,对原始数据进行精简和合并,同时基于合并后的个体数据,采用多重数据加权插值方式进一步提升个体的出行时空轨迹的精确度,以此为基础,更新并维护PID(Personal IDentify,个体标识,PID)与运营商卡号的相互映射表,以便后续用于具体统计分析时进行缩样处理,即只统计PID数量,降低一人多卡对总体统计的影响。
发明内容
本发明的目的是利用移动通信设备与固定传感器之间的通信记录组成的个体出行时空轨迹所表征个体在空间上的移动情况,提供对同时期不同卡号的出行时空轨迹进行采样和比较,判断其相似性,并以此为基础构建一人多卡判别的一致性指标,对通过不同移动通信卡记录下的出行轨迹是否属于同一人进行识别和判断,对于存在多卡使用的个体,利用多卡的通信记录完善个体出行时空轨迹,并从多个卡号中选择记录最完善的一个,以此为基础,更新并维护个体标识PID与运营商卡号的相互映射表,以便后续用于具体统计分析时缩样处理,即只统计PID数量,降低一人多卡对总体统计的影响。
为了达到上述目的,本发明的技术方案是提供了一种大数据环境下构建一人多卡识别算法及其一致性校验指标,包括以下步骤:
步骤1、从传感器运营商获取匿名加密移动终端传感器数据,匿名加密移动终端传感器数据在时间与空间上连续,不同移动终端单向不可逆加密卡号对应不同编号,提取每个卡号在指定时间段内所触发的通信信令记录,构成个体通过该卡号记录下的出行时空通信记录数据集合,对其按时间排列,将其空间位置投射到地图上,在数据配准的基础上,通过时空插值法对其记录的样点按等时间间隔进行扩充,获得以每张移动通信卡号为识别标志的出行时空轨迹;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海世脉信息科技有限公司,未经上海世脉信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011142356.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置