[发明专利]基于LSTM的滴滴订单需求预测方法及装置在审
申请号: | 202010593477.0 | 申请日: | 2020-06-27 |
公开(公告)号: | CN111753910A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 李颖;杨晓萌;朱东阳;杨润佳;田濡霞;贺伟;盖腾飞 | 申请(专利权)人: | 长安大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06Q30/02;G06Q50/30 |
代理公司: | 西安恒联知识产权代理有限公司 61251 | 代理人: | 杨银娟 |
地址: | 710064*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lstm 滴滴 订单 需求预测 方法 装置 | ||
1.基于LSTM的滴滴订单需求预测方法及装置,其特征在于,包括以下步骤:
对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;
对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;
根据子区域中的区域数据簇训练基于长短期记忆网络的订单预测模型;
通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;
计算热点区域的订单差值,根据订单差值判断子区域该时段的滴滴需求量。
2.根据权利要求1所述的方法,其特征在于,所述对获取到的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;具体包括:
清除获取的GPS订单数据中的空值及缺失数据;
清除GPS订单数据中的轨迹信息,保留每一订单中的起点和终点数据信息;
根据起点和终点数据的经纬度信息将其匹配到路网。
3.根据权利要求2所述的方法,其特征在于,所述GPS订单数据包括司机ID,乘客ID,移动轨迹信息、上下车经纬度,上下车时间,所述预处理数据包括上下车经纬度及上下车时间。
4.根据权利要求2所述的方法,其特征在于,所述根据起点和终点数据的经纬度信息将其匹配到路网,具体为:采用QGIS、MAPGIS或ArcGIS标记软件,将订单数据的起点和终点匹配到路网上。
5.根据权利要求1所述的方法,其特征在于,对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;具体包括:
第一步,对预处理数据进行k-means聚类分析,从预处理数据选择k个初始中心点,作为聚类中心;
第二步,计算预处理数据中各点分别到k个聚类中心的距离,将该点分到最近的聚类中心,行成k个簇,其计算公式如下:
其中di表示第i个点到k个聚类中心的最小距离,xi、yi分别表示第i个点的经度和纬度,xj、yj分别表示第j个聚类中心的经度和纬度,i=1,2,3…n,j=1,2,3,…k;
第三步,计算每个组别内所有对象数据的均值,并将得到的均值作为新的质心;
第四步,重复第二步和第三步,直到质心的位置不再发生变化形成区域数据簇;
第四步,根据区域数据簇将实际地图道路网络划分若干子区域。
6.根据权利要求1所述的方法,其特征在于,所述根据子区域中的区域数据簇训练基于长短期记忆网络的订单预测模型,具体包括:
将所获每一天的预处理数据依据时间划分为二十四个时段;
统计每一时段内每一子区域内每隔10min的该区域为起点的订单总量和以该区域为终点的订单总量;
通过Z-score方法,将每一子区域内以该区域为起点的订单总量和以该区域为终点的订单总量标准化;
使用子区域的订单总量中第一时间段数据进行网络模型的训练,选择第二时间段数据作为测试数据以评估模型性能;
长短期记忆网络的细胞状态更新具体计算公式如下:
Ct=Ct-1⊙ft+it⊙at;
其中,Ct为细胞状态,ft为遗忘门的输出,it和at为输入门的两个输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010593477.0/1.html,转载请声明来源钻瓜专利网。