[发明专利]多源数据挖掘的公交车上下车站点识别和检验方法有效
申请号: | 201910123126.0 | 申请日: | 2019-02-19 |
公开(公告)号: | CN109903553B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 王成;崔紫薇;陈德蕾 | 申请(专利权)人: | 华侨大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01 |
代理公司: | 泉州市文华专利代理有限公司 35205 | 代理人: | 张浠娟 |
地址: | 362000 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 挖掘 公交 车上 下车 站点 识别 检验 方法 | ||
1.一种多源数据挖掘的公交车上下车站点识别和检验方法,其特征在于:所述方法包括如下步骤:
步骤S1、根据常规公交的IC刷卡数据以及运营车辆数据,对于不同乘客在同一天同一线路号同一班次公交车的常规公交乘客IC刷卡时间进行聚类,并进行关联分析确定常规公交IC刷卡乘客上车站点识别;
步骤S2、根据常规公交、BRT和地铁的IC刷卡数据以及运营车辆数据,进行基于常规公交、BRT、地铁的IC刷卡数据组成的IC刷卡乘客出行链下车站点识别;
步骤S3、对未识别下车站点的数据进行基于历史乘车记录的常规公交IC刷卡乘客下车站点识别;
步骤S4、对仍未识别下车站点的数据进行基于贝叶斯后验最大似然估计的常规公交IC刷卡乘客下车站点识别;
步骤S5、对已匹配上车站点的常规公交IC刷卡数据,进行基于配对样本t检验的常规公交IC刷卡乘客上车站点识别检验;同时,对已匹配下车站点的常规公交IC刷卡数据,进行基于换乘行为识别的常规公交IC刷卡乘客下车站点识别检验。
2.根据权利要求1所述的多源数据挖掘的公交车上下车站点识别和检验方法,其特征在于:在所述步骤S1中,对于不同乘客在同一天同一线路号同一班次公交车的常规公交乘客IC刷卡时间进行聚类,并进行关联分析确定常规公交IC刷卡乘客上车站点识别具体包括如下步骤:
步骤101、判断第k个乘客的第i条交易数据之后是否存在第i+1条交易数据,若是,则进入步骤102;若否,则进入步骤103;
步骤102、对于第i条交易数据和第i+1条交易数据,判断是否同时满足式(1)和式(2):
JYRQk,i=JYRQk,i+1 (1)
JYSJk,i+1-JYSJk,iTqx (2)
在式(1)中,JYRQk,i为第i条交易数据的交易日期,JYRQk,i+1为第i+1条交易数据的交易日期;在式(2)中,JYSJk,i为第i条交易数据的交易时间,JYSJk,i+1为第i+1条交易数据的交易时间,Tqx为最大连续刷卡时间间隔;
若同时满足式(1)和式(2),则删除该第k个乘客的第i+1条交易数据,并进入步骤103;
若不同时满足式(1)和式(2),则不做改动,并进入步骤103;
步骤103、寻找第f辆常规公交的第j条记录,判断第f辆常规公交的第j条记录与第k个乘客的第i条交易数据是否同时满足式(3)、式(4)和式(5):
JYRQk,i=GRQf,j (3)
XLHk,i=GXLHf,j (4)
CPHk,i=GCPHf,j (5)
在式(3)中,JYRQk,i为第k个乘客的第i条交易数据的交易日期,GRQf,j为第f辆常规公交的第j条记录的交易日期;在式(4)中,XLHk,i为第k个乘客的第i条交易数据的线路号,GXLHf,j为第f辆常规公交的第j条记录的线路号;在式(5)中,CPHk,i为第k个乘客的第i条交易数据的车牌号,GCPHf,j为第f辆常规公交第j条记录的车牌号;
若同时满足式(3)、式(4)和式(5),则继续判断是否满足式(6):
(min|JYSJk,i-GSJf,j|)Tys (6)
在式(6)中,JYSJk,i为第k个乘客的第i条交易数据的交易时间,GSJf,j为第f辆常规公交的第j条记录的时间,Tys为最小公交刷卡与公交到站时间差值;
如果满足式(6),则删除该第k个乘客的第i条交易数据,并进入步骤108;
如果不满足式(6),则不做改动,并进入步骤104;
若不同时满足式(3)、式(4)和式(5),则删除该第k个乘客的第i条交易数据,并进入步骤108;
步骤104、将第k个乘客的第i条交易数据的交易时间JYSJk,i和第f辆常规公交的第j条记录的时间GSJf,j,均统一转换为以一天的00:00:00为参照的以秒为单位的数字型的相对数值;
步骤105、对于第f辆常规公交所包括的J条数据,逐一判断每一条数据是否为进站时的值,即满足式(7):
GJCZf,j≠Njcz,j=1,2,…,J (7)
在式(7)中,Njcz为进站时的值,GJCZf,j表示第f辆常规公交的第j条数据的状态取值;
如果是,则保留对应的数据,如果否,则删除对应的数据;且在J条数据都判断完后,进入步骤106;
步骤106、寻找第z个站点的站点信息,判断第z个站点的站点信息与第f辆常规公交的第j条记录是否同时满足式(8)和式(9):
GXLHf,j=ZDXLHZ (8)
GZDBHf,j=ZDBHz (9)
在式(8)中,GXLHf,j为第f辆常规公交的第j条记录的线路号,ZDXLHZ为第z个站点的线路号;在式(9)中,GZDBHf,j为第f辆常规公交的第j条记录的站点编号,ZDBHz为第z个站点的站点编号;
若同时满足式(8)和式(9),则该第j条记录即为到达第z个站点时的记录,将该第j条记录的交易时间记为GSJf,j,z,并进入步骤107;
若不同时满足式(8)和式(9),则从第f辆常规公交的记录中删除该第j条记录,并进入步骤103;
步骤107、对于按照交易先后排序的第k,k+1,...,k+n个乘客的交易数据和第f辆常规公交的第j条记录,判断是否同时满足式(10)、式(11)、式(12)和式(13):
XLHk,i=XLHk+1,i=...=XLHk+n,i=GXLHf,j (10)
CPHk,i=CPHk+1,i=...=CPHk+n,i=GCPHf,j (11)
JYRQk,i=JYRQk+1,i=...=JYRQk+n,i=GRQf,j (12)
|JYSJk,i-JYSJk+1,i|,|JYSJk+1,i-JYSJk+2,i|,…≤Tjl (13)
在式(10)中,XLHk,i=XLHk+1,i=...=XLHk+n,i分别为第k,k+1,...,k+n个乘客的交易数据的线路号,GXLHf,j为第f辆常规公交的第j条记录的线路号;在式(11)中,CPHk,i=CPHk+1,i=...=CPHk+n,i分别为第k,k+1,...,k+n个乘客的交易数据的车牌号,GCPHf,j为第f辆常规公交的第j条记录的车牌号;在式(12)中,JYRQk,i=JYRQk+1,i=...=JYRQk+n,i分别为第k,k+1,...,k+n个乘客的交易数据的交易日期,GRQf,j为第f辆常规公交的第j条记录的交易日期;在式(13)中,Tjl为两公交站点间的最大运行时间差值;
若同时满足式(10)、式(11)、式(12)和式(13),则说明第k,k+1,...,k+n个乘客均为在同一个站点上车的同一类乘客;
同时,针对常规公交在真实到站后GPS仍未显示到站的情况,分别设置第一缓冲时间Tone和第二缓冲时间Ttwo;
如果第k,k+1,...,k+n个乘客的交易数据的交易时间均处在GSJf,j,z-Ttwo到GSJf,j,z-Tone之间,即满足式(14):
GSJf,j,z+ToneJYSJk,i,JYSJk+1,i,…GSJf,j,z-Ttwo (14)
且第i条交易数据的交易时间JYSJk,i与GSJf,j之间的差值最小,即满足式(15):
min{|JYSJk,i-GSJf,j,z|},z=1,2,…,Z (15)
则第z个站点名即为第k个乘客的第i条交易数据的上车站点名,即:
UPstationk,i=ZDMz (16)
同时,同一类的第k+1,...,k+n个乘客的第i条交易数据的上车站点名也为ZDMz,即:
UPstationk+1,i=...=UPstationk+n,i=ZDMz (17)
,之后进入步骤108;
否则,如果不同时满足式(14)和式(15),则说明第k个乘客的交易数据无法匹配上车站点,并进入步骤108;
若不同时满足式(10)、式(11)、式(12)和式(13),则删除该第k个乘客的第i条交易数据,并进入步骤108;
步骤108、判断第k个乘客的交易数据是否均匹配了上车站点,如果是,则进入步骤109,如果否,则将未匹配上车站点的交易数据作为第i条交易数据,并返回步骤101;
步骤109、判断第k个乘客是否为最后一个有上车站点未匹配交易数据的乘客,如果是,则结束上车站点匹配;如果否,则将下一个有未匹配上车站点交易数据的乘客作为第k个乘客,并返回步骤101。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910123126.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交通制冷信号器
- 下一篇:一种基于Spark的路网交通运行分析方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置