[发明专利]一种多维交通出行数据融合与数据质量检测方法有效
申请号: | 202111097329.0 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113742330B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 罗建平;陈欢;戴宇聪;杨森彬;尹杰丽;李志武;陈招帆;喻莲 | 申请(专利权)人: | 广州交信投科技股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/245;G06F16/29 |
代理公司: | 广州汇航专利代理事务所(普通合伙) 44537 | 代理人: | 韩广 |
地址: | 510663 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多维 交通 出行 数据 融合 质量 检测 方法 | ||
本发明公开了一种多维交通出行数据融合与数据质量检测方法,包括以下步骤:S1:数据汇集:从不同平台、系统获取不同类型交通工具的原始出行数据,其包括数据采集组件、数据存储组件和数据预处理三大组件;S2:数据融合:包括数据级别融合、特征级别融合以及决策级别融合三个层级;S3:融合数据质量检测。本发明可用多维交通出行数据做更客观准确的乘客出行规律分析、公交断面客流预测、出租车载客线路推荐以及共享多维交通出行融合数据,提供了一套双闭环融合数据质量检测的方法,最大限度保证数据质量;解决交通领域多种交通工具数据源相互独立,在判断出行特征的时候就会产生很大的误差,影响数据分析、算法开发的准确性的问题。
技术领域
本发明涉及数据融合技术领域,具体为一种多维交通出行数据融合与数据质量检测方法。
背景技术
随着互联网、大数据技术突飞猛进地发展,数据量不断增加,但同时大数据量下信息挖掘也面临新的挑战。如何从海量数据中挖掘有用信息成为了重要的研究对象。多维、多源数据融合为海量数据挖掘提供更客观、全面的信息来源。多维、多源数据融合对于行业分析、预测以及其他场景的应用具有重要意义,例如,对于捕捉个人出行链场景,由于出行时可能同时使用多种交通工具,如果公交、出租等多种交通工具数据源相互独立,在判断出行链的时候就会产生很大的误差,影响数据分析、算法开发的准确性。从交通行业多种应用场景考虑,多维、多源数据融合也是非常重要。
现阶段数据融合在不同领域、不同行业也都有相应的研究和应用落地场景。但是,对于交通行业,从整体而言,对多维交通出行链数据融合方法、以及多维交通融合出行链数据质量检测方法研究与应用仍然存在较大的空白。
另外,由于各个行业数据源相互独立的问题,无法共享数据进行融合数据规律分析、以及人工智能的应用。导致分析出的规律与实际情况存在较大的差距,AI模型存在较大的误差。
发明内容
本发明的目的在于提供一种多维交通出行数据融合与数据质量检测方法,最大限度保证了数据质量,且通过多维交通出行数据可做更客观准确的乘客出行规律分析、公交断面客流预测、出租车载客线路推荐以及共享多维交通出行融合数据,大大提高现有技术的工作效率,以解决交通领域多种交通工具数据源相互独立,在判断出行特征的时候就会产生很大的误差,影响数据分析、算法开发的准确性的问题。
为实现上述目的,本发明提供如下技术方案:
一种多维交通出行数据融合与数据质量检测方法,包括以下步骤:
S1:数据汇集:从不同平台、系统获取不同类型交通工具的原始出行数据,其包括数据采集组件、数据存储组件和数据预处理三大组件;
S2:数据融合:包括数据级别融合、特征级别融合以及决策级别融合三个层级;为了获取多维交通出行融合数据表,采用数据级别融合和特征级别融合;其中,数据级融合包括网约车、出租车、共享单车的出行数据的起止点具体位置、经纬度、时间、车辆信息、用户id、日期、交通工具类型的特征提取;特征级融合包括公交-地铁、私家车的出行特征提取,以及所有交通工具的起止点空间特征提取;
S3:融合数据质量检测。
更进一步地,S1中通过数据采集组件从不同平台或系统获取得到的公交、地铁、出租车、网约车、共享单车、私家车出行数据以及公交车、地铁刷卡数据、出租车、网约车、共享单车订单数据、私家车卡口过车数据均为结构化数据,并将结构化数据作为多维交通出行数据源。
更进一步地,S1中的数据存储组件从多个不同系统获取到的多维交通出行数据,以分布式的方式存储在大数据平台中。
更进一步地,S1中的数据预处理组件用于对原始数据做缺失情况检验,校验后的数据根据数据质量情况做进一步处理,并把数据质量上传到多源数据提供系统上,供源头数据提供方做数据质量提升;具体方法如下:
S101:缺失值处理:对于字段缺失个数占比超过80%的记录,直接剔除;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州交信投科技股份有限公司,未经广州交信投科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111097329.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置