[发明专利]一种多维交通出行数据融合与数据质量检测方法有效
申请号: | 202111097329.0 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113742330B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 罗建平;陈欢;戴宇聪;杨森彬;尹杰丽;李志武;陈招帆;喻莲 | 申请(专利权)人: | 广州交信投科技股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/245;G06F16/29 |
代理公司: | 广州汇航专利代理事务所(普通合伙) 44537 | 代理人: | 韩广 |
地址: | 510663 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多维 交通 出行 数据 融合 质量 检测 方法 | ||
1.一种多维交通出行数据融合与数据质量检测方法,其特征在于,包括以下步骤:
S1:数据汇集:从不同平台、系统获取不同类型交通工具的原始出行数据,其包括数据采集组件、数据存储组件和数据预处理三大组件;
S2:数据融合:包括数据级别融合、特征级别融合以及决策级别融合三个层级;为了获取多维交通出行融合数据表,采用数据级别融合和特征级别融合;其中,数据级别融合包括网约车、出租车、共享单车的出行数据的起止点具体位置、经纬度、时间、车辆信息、用户id、日期、交通工具类型的特征提取;特征级别融合包括公交-地铁、私家车的出行特征提取,以及所有交通工具的起止点空间特征提取;
其中,数据融合采用基于地理网格化技术改进后的空间特征提取方法过程如下:
S201:目标区域空间网格化:根据业务需求,选定目标区域,采用空间网格化技术把目标区域空间划分为多个网格,具体采用geohash网格编码技术,并结合误差需求以粒度为8位geohash对目标区域划分为多个网格,其中8位geohash的空间误差为19米;
S202:网格归属区域信息:依次求出每个8位geohash网格所在的归属区域,以目标区域空间中的一个8位geohash求解方法如下:
S2021:求出8位geohash的中心,并用经纬度表示该中心;
S2022:以该中心为中心,边长为10公里的正方形区域,筛选出所有备选区域,具体筛选方式为:
(1)求出正方形区域的最西北点和最东南点的经纬度,分别表示为(lng_w,lat_n),(lng_e,lat_s);
(2)求出所有交通小区围栏区域最西北点和最东南点的经纬度,表示为(lng_wi,lat_ni),(lng_ei,lat_si);
(3)筛选出满足要求的可能交通小区,满足要求的条件如下:
由上述筛选方式可快速筛选出满足要求的备选区域;
S2023:遍历S2022中得到的所有备选区域,由备选区域围栏以及待求8位geohash中心的经纬度,用点是否在指定围栏内算法判断该经纬度所归属的区域即可;
S203:距离网格最近的区域信息:依次求出每个8位geohash网格最近的区域信息,其求解方法如下:
S2031:求出该8位geohash的中心,并用经纬度表示该中心(lng,lat);
S2032:以该中心为中心,边长为4公里的正方形区域,筛选出所有备选区域,具体筛选方式为:
(1)求出正方形区域的最西北点和最东南点的经纬度,分别表示为(lng_w,lat_n),(lng_e,lat_s);
(2)每个站点经纬度表示为(lng_wi,lat_ni),(lng_ei,lat_si);
(3)筛选出在正方形区域的所有公交站点,满足要求的条件如下:
S2033:用经纬度距离计算公式,依次求得所有备选站点到该8位geohash的中心(lng,lat)的距离,找出距离最近的那个站点信息以及距离;
按上述步骤可依次求出目标区域所有空间网格归属的站点及距离信息;
S204:通过S201-S203基于地理网格化技术求得的空间特征基础信息与每条出行记录的起止点对应的8位geohash做聚合,可快速提取出每条出行记录起止点的空间特征;
为了减少特征级别融合过程中的时间复杂度,在提取空间特征时对特征提取算法优化如下:
(1)统一出行起止点经纬度类型,统一规范为wgs84类型经纬度;
(2)对出行起止点按经纬度进行8位geohash编码;
(3)生成目标区域所有8位geohash所对应的相关基础信息表;
(4)以数据级别融合数据与目标区域所有8位geohash所对应的数据信息分别聚合,分别以出行起止点的8位geohash和基础信息数据的8位geohash作为聚合键,得到出行起止点所对应的交通小区、街道、管辖区、所在的重要活动场所、距离最近的公交、地铁站点情况字段;
(5)完成出行起止点所对应特征级字段融合;
S3:融合数据质量检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州交信投科技股份有限公司,未经广州交信投科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111097329.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置