[发明专利]一种基于C4.5决策树的手机用户出行方式识别方法在审
| 申请号: | 201510549482.0 | 申请日: | 2015-09-01 |
| 公开(公告)号: | CN105101092A | 公开(公告)日: | 2015-11-25 |
| 发明(设计)人: | 李振邦;冉斌;孟华;彭敏;高大震;邵莉欣 | 申请(专利权)人: | 上海美慧软件有限公司 |
| 主分类号: | H04W4/02 | 分类号: | H04W4/02;G01S5/02 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200434 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 c4 决策树 手机用户 出行 方式 识别 方法 | ||
技术领域
本发明涉及交通规划与管理方法技术领域,具体是一种基于C4.5决策树的手机用户出行方式识别方法。
背景技术
各种交通方式的出行比例、公共交通分担率等,一直是交通规划与交通管理部门所关注的重要数据。在交通分析中,常用的交通信息采集手段包括线圈、微波、视频等。不同的信息采集手段都有其优势与适用范围。
由于线圈、微波、视频等交通采集手段的使用空间范围较小,无法对人们出行行为进行持续且有效的追踪,更难以获取人们出行的OD信息。这些交通信息采集设备一般成本较高,由于成本与使用范围的限制,无法对整个城市进行大范围的覆盖。
在现代社会,由于手机用户量庞大,运营商为了提供优质的通信服务,通过增加基站建设,与使得信号覆盖更广,手机信号覆盖范围广,因此手机信号数据很适合用于分析人们出行的行为,从而优化城市的交通规划与管理。
目前,使用手机信号数据在进行出行起终点分析、断面手机客流量统计等初级应用已经逐渐成熟。但以手机信号数据作为数据源,进行精细化的分析还不多,例如如何识别手机用户的出行交通方式一直是业界难题。这是因为尽管手机信号能够广泛覆盖,但是基站定位的精度较低,属于模糊定位,因为无法像分析GPS数据一样,可以通过出行过程的速度值,判断用户的出行交通方式。但是GPS用户比例远远低于手机用户比例,并且GPS数据只能说明特定人群的出行特征,无法真实反映普罗大众的出行状况。
尽管手机信号数据在定位精度上存在不足,但是人们出行交通方式的识别,对城市规划与交通规划都有着重要的意义,并且手机用户群体膨大,接近统计学上的全样本。
发明内容
本发明的目的在于提供一种准确度高、使用方便的基于C4.5决策树的手机用户出行方式识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于C4.5决策树的手机用户出行方式识别方法,具体步骤如下:
(1)根据研究区域人们常用的出行交通工具,募集相应出行方式的志愿者,获取志愿者的出行情况信息与相应的手机信令数据;
(2)采集志愿者的手机信令数据,基于用户编号将采集到的手机信令数据分为不同的组,再依据时间进行组内排序,形成不同志愿者的手机出行轨迹序列;
(3)按照停留时间,识别出每个手机出行轨迹序列中每次出行的起点与终点,每对起点与终点之间的行程过程就是当前手机出行轨迹中的一次出行过程;
(4)根据每次出行过程对应的手机数据,提取当前出行过程的出行过程特征,得到所有志愿者的所有出行过程特征,从而形成样本数据集;
(5)将样本数据集中的A%的数据作为训练数据集,将样本数据集中剩余的B%的数据作为测试数据集,使用C4.5决策树算法,在训练数据集中,通过模型训练,获取采用当前交通工具出行时的出行过程特征的规律,从而为用不同的交通工具出行时找到不同的手机数据特征的规律,生成决策树模型,其中,A+B=100,且A>B;
(6)再将步骤(5)所生成的决策树模型应用到测试数据集中,判断决策树模型的识别准确率是否达到预期要求,若未能达到预期要求,则或者累积更多的志愿者数据后返回步骤(2),或者返回步骤(5)对算法参数进行调整;若达到预期要求,则对决策树模型进行部署。
作为本发明再进一步的方案:所述的步骤(4)中的出行过程特征至少包括理论距离、出行时长、平均速度、轨迹点累计距离、是否有地铁站内记录、地铁出行时长、地铁出行距离、地铁出行距离占总比、地铁出行时间占总比和路径复杂度。
与现有技术相比,本发明的有益效果是:
本发明能够根据不同城市的基站建设情况、手机信号特点,通过人工智能的方法,自动学习并获取适用于该城市与地区的出行方式识别方法,为交通管理与规划提供高质量的数据分析结果。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
一种基于C4.5决策树的手机用户出行方式识别方法,具体步骤如下:
(1)根据研究区域人们常用的出行交通工具,如:省、市、区等,募集相应出行方式的志愿者,获取志愿者的出行情况信息与相应的手机信令数据;
(2)采集志愿者的手机信令数据,基于用户编号将采集到的手机信令数据分为不同的组,再依据时间进行组内排序,形成不同志愿者的手机出行轨迹序列;
(3)按照停留时间,识别出每个手机出行轨迹序列中每次出行的起点与终点,每对起点与终点之间的行程过程就是当前手机出行轨迹中的一次出行过程;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海美慧软件有限公司,未经上海美慧软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510549482.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:更新多媒体广播多播控制信道信息的方法及设备
- 下一篇:定位的方法和装置





