[发明专利]一种基于大数据的航空数据分析方法、设备及存储介质在审
申请号: | 201811018169.4 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109446275A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 刘晓葳;肖龙源;蔡振华;李稀敏;谭玉坤 | 申请(专利权)人: | 厦门快商通信息技术有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361007 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于大数据的航空数据分析方法、设备及存储介质,该方法包括:构建航班系统模型,所述航班系统模型采用K均值聚类算法;获取航空公司的航线过往原始数据;对航线过往原始数据进行预处理,所述预处理包括:将经过预处理后的航空公司的过往数据导入航班系统模型进行训练,得到航班K分类的结果。本发明将航空公司过往数据通过K均值聚类算法进行大数据分析结果供航班调整有了具体数据参考,更加的合理,避免根据人为经验判断来调整航的不精确问题,提高资源利用率,有利于提高航空公司收益。 | ||
搜索关键词: | 预处理 航班 系统模型 大数据 存储介质 过往数据 航空数据 原始数据 航线 资源利用率 经验判断 数据参考 构建 分析 分类 收益 | ||
【主权项】:
1.一种基于大数据的航空数据分析方法,其特征在于,包括如下步骤:步骤一,构建航班系统模型;所述航班系统模型采用K均值聚类算法,所述K均值聚类算法如下:1)从N个数据随机选取K个数据作为质心,其中N、K均为正整数,且N≥K;2)对剩余的每个数据测量其到每个质心的距离,并把它归到最近的质心的类;3)重新计算已经得到的各个类的质心;4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,K均值聚类算法结束;步骤二,获取航空公司的航线过往原始数据;所述航线过往原始数据包含以下一种或者多种:“passengerMeter”客公里、“seatMeter”座公里、“avincome”平均收入、“CAP”运力、“passengerNum”乘客数、“saleDiscount”折扣、“mileage”里程、“PLF”客座率、“seatLeft”、“flightDate”航班日期、“flightNum”航班号、“上座率”;步骤三,对航线过往原始数据进行预处理,所述预处理包括:1)从航线过往原始数据提取有效数据;有效数据提取基于目前的分析目标,航线过往原始数据是对航班做多次数据收集得到的结果,其中存在大量的“非充分信息”,对得到的航线过往原始数据做二次提取,取‘receiveDate’处于结算点上的数据作为结算数据;2)对有效数据进行数据完善;对有效数据中代表航线的‘airline’字段,将其拆分为前后代表始发站/终点站的各多个字母,引入多个字码表,生成带有始发/终点机场和城市信息的数据序列,加入数据框。步骤四,将经过预处理后的航空公司的过往数据导入航班系统模型进行训练,得到航班K分类的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息技术有限公司,未经厦门快商通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811018169.4/,转载请声明来源钻瓜专利网。