[发明专利]一种基于主题模型的多因素融合民航旅客出行预测方法有效
申请号: | 201611159984.3 | 申请日: | 2016-12-15 |
公开(公告)号: | CN106779214B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 刘杰;王嫄;冯丽娜;陈会朋 | 申请(专利权)人: | 南开大学 |
主分类号: | G06F17/40 | 分类号: | G06F17/40 |
代理公司: | 天津佳盟知识产权代理有限公司 12002 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 模型 因素 融合 民航 旅客 出行 预测 方法 | ||
1.一种基于主题模型的多因素融合民航旅客出行预测方法,采用数据挖掘理论和方法对民航数据中旅客出行行为进行分析,运行环境要求所使用的计算机平台配备不低于8G的内存,CPU核心数不低于4个且主频不低2.6GHz、Windows 7及以上版本的64位操作系统,并安装Oracle数据库、Java 1.7及以上版本、Matlab 2011b及以上版本必备软件环境;其特征在于,该方法包括:
步骤1):构建旅客关联图出行主题模型;包括构建旅客的关联图,并对旅客出行选择概率分布进行主题建模,最终得到旅客关联图出行主题模型:
步骤1.1)、构建旅客关联图;
构建旅客关联图,就是计算旅客之间的关联度,它由旅客航线共现度和属性共现度共同决定;航线共现度由旅客之间的航线共现数决定;属性共现度是指旅客的年龄、性别、平均折扣、平均里程是否相同;旅客年龄、平均折扣、平均里程信息由基于方差的切分方法得到;
步骤1.2)、对旅客出行选择概率分布主题建模;
基于主题模型对旅客和其搭乘的航线、航空公司进行主题建模,发现并求得旅客、航线、航空公司的潜在主题分布,最终将旅客的潜在主题分布和航空公司、航线的潜在主题分布相结合,得到旅客对航空公司和航线的出行选择概率分布信息;
步骤1.3)、构建旅客关联图出行主题模型;
在步骤1.2)主题建模过程中加入步骤1.1)中的旅客关联图,以构建旅客关联图出行主题模型(Passenger Graph based Travel Topic Model,PGTTM);PGTTM在为每个旅客的航线、航空公司分配主题时,使得主题不仅来自于旅客本身,还有可能来自于旅客关联的其他旅客;这样能够丰富主题信息,提高预测性能,并减轻民航旅客出行稀疏性的问题;
步骤2):构建航线热度、旅客忠诚度、航空公司市场占有率计算模型,利用这些先验知识,能够帮助后面准确预测:
步骤2.1)、计算航线的热度;
对于航线热度,首先统计该航线被全部旅客搭乘的次数,以及每个航线被全部旅客搭乘的次数之和,在此基础上,计算得到航线热度;
步骤2.2)、计算旅客对航空公司的忠诚度;
对于旅客忠诚度,首先统计该旅客搭乘该航空公司的次数,以及该旅客搭乘每一个航空公司的次数之和,在此基础上,经过平滑处理,计算得到旅客对航空公司的忠诚度;
步骤2.3)、计算航空公司对航线的市场占有率;
对于航空公司市场占有率,首先统计该航空公司、该航线作为一个词对被全部旅客搭乘的次数,以及在不考虑航空公司下该航线被全部旅客搭乘的次数,基于此,计算得到航空公司对航线的市场占有率;
步骤3):通过贝叶斯概率模型,构建多因素融合预测框架;通过贝叶斯概率模型融合航线热度、旅客对航线选择概率分布、旅客忠诚度以及航空公司市场占有率,对旅客将来选择的航线、航空公司进行预测:
步骤3.1)、基于贝叶斯概率模型的多因素融合;
基于步骤1.3)中PGTTM得到的旅客对航线选择概率分布,步骤2.1)中的航线热度,步骤2.2)中的旅客忠诚度,以及步骤2.3)中的航空公司市场占有率,构建贝叶斯概率模型,对这四部分因素进行融合,更好建模旅客的出行行为;
步骤3.2)、基于贝叶斯概率模型的多因素预测;
针对每个旅客、每个航空公司-航线词对,利用贝叶斯概率模型函数,分别计算旅客的搭乘概率;对每个旅客而言,挑选出概率最大的几个航空公司-航线词对,进行预测和推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611159984.3/1.html,转载请声明来源钻瓜专利网。