[发明专利]一种基于居民调查数据获取带有标签的手机信令轨迹数据方法有效
申请号: | 201911019390.6 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110753307B | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 张改;陆振波;刘娟;刘欢;万紫吟;张静芬;张念启;丁向燕;施玉芬;刘晓庆 | 申请(专利权)人: | 南京瑞栖智能交通技术产业研究院有限公司 |
主分类号: | H04W4/029 | 分类号: | H04W4/029;G06Q50/26 |
代理公司: | 南京天华专利代理有限责任公司 32218 | 代理人: | 刘畅 |
地址: | 210000 江苏省南京市经*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 居民 调查 数据 获取 带有 标签 手机 轨迹 方法 | ||
本发明公开了一种基于居民调查数据获取带有标签的手机信令轨迹数据方法,包括以下步骤:S1获取手机信令轨迹数据以及居民出行调查数据的基本属性信息;S2基于手机基站与交通小区的空间对应关系将手机出行OD转化成交通小区出行OD;S3针对不同日期提取手机信令轨迹数据以及居民出行调查数据的特征集合,对数据进行时间纬度上的初步融合;S4基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配;S5结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,获得带有标签的手机信令轨迹数据。实现了手机信令数据大样本与居民出行调查数据小样本的数据融合。
技术领域
本发明涉及大数据、小数据匹配领域,具体是一种带有标签的手机信令轨迹数据获取方法。
背景技术
通信与互联网技术的发展与普及应用,应运而生的是对其背后蕴藏的大量潜在信息的大数据的挖掘研究。据工信部统计,截止2015年底,全国手机用户已达12.86亿,手机普及率为每百人94.5部。其手机信令数据以其内涵丰富、采样率高以及时效性好等优良特性吸引了大量学者的关注。然而手机信令数据出于保护隐私以及数据采集字段自身的一些局限性的缘故,很难获取准确的带有标签的样本信息,如出行者的类型属性以及出行方式,这将阻碍交通分析、交通规划等相关专题研究的进一步推进。
从通信网络获取的手机信令数据是由运营商经过匿名处理的位置大数据,一方面得益于其不涉及用户隐私在很多宏观领域的研究中得到了广泛的应用,另一方面匿名的特性也给研究带来了一些阻碍。尤其是在颗粒度较为精细的个体出行链研究中,由于很难获取到该用户真实的出行信息,导致无法搭建数据与真实场景之间桥梁,很难检验科研结果的准确性。
传统居民调查是由当地规划部门组织,获取居民交通需求最基本的途径,尽管在大数据发展如火如荼的今天,传统抽样调查仍是不可被抛弃的交通信息获取手段。北京、上海等大城市都开展过多次综合交通调查,而且建立了长效机制,定期组织开展综合交通调查以及各种专项交通调查。一方面传统居民出行调查得到的个人属性以及出行信息的完整度较高,包含有性别、年龄、出行目的、出行方式等属性。另一方面由于居民出行调查的组织者是当地政府部门,而且采用的是分级抽样调查的方法,可以有效的避免获取的样本数据在人群和时空分布上的偏向性,更具随机性。
相比于手机信令轨迹数据,居民出行调查数据是一种属性丰富的抽样小数据,这两类数据源的融合匹配为手机轨迹样本的出行方式标签获取提供了一条新思路。
目前,对于大数据与小数据匹配结合的研究较少,相近的有张晨等人提出的一种基于多签到数据的标签匹配算法。包括以下步骤:1)基于单个用户的多种签到数据间具有时间和空间相近的时空相关性,计算多个标签之间的正负关系;2)基于标签之间的正负关系,构建面向多签到数据的符号网络;3)摒弃不适用于签到数据符号网络的分割条件,并通过增加权值分布密度来改进已有FEC社区发现算法的分割机制,以适应签到数据符号网络的特性,实现多标签的划分;4)利用仿真实验分析实现多类别的签到数据的标签匹配。该方案局限于匹配同一用户具有时空相关性的不同种类的签到数据,而由于居民调查出行数据是由人工填写获取,存在时间和空间纬度的误差。
发明内容
本发明针对背景技术中存在的问题:现有的多源数据特征标签匹配方法中,对于所匹配的数据源时空相关性要求较高。而同一用户产生的各类不同的数据中,由于误差的存在会导致数据源间时空相关性差,使得最终匹配结果精度不高。
本发明基于居民调查数据与手机信令轨迹数据,根据数据的出行特征及个体属性特征相关性的特点,从数据样本整体角度出发,提取出行者的出行相关特征以及用户基本属性信息,通过时空分类汇聚进行初步处理。然后基于每一条居民出行调查数据的出行特征属性,在所设定的匹配规则下对手机信令轨迹数据进行初步筛选匹配。最后结合出行者与手机用户的个人特征属性,完成对居民出行调查数据与手机信令轨迹数据最终的特征匹配,得到匹配成功的手机信令轨迹数据的扩展属性,实现手机信令数据大样本与居民出行调查数据小样本的数据融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京瑞栖智能交通技术产业研究院有限公司,未经南京瑞栖智能交通技术产业研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911019390.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置