[发明专利]一种基于主题模型的多因素融合民航旅客出行预测方法有效
申请号: | 201611159984.3 | 申请日: | 2016-12-15 |
公开(公告)号: | CN106779214B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 刘杰;王嫄;冯丽娜;陈会朋 | 申请(专利权)人: | 南开大学 |
主分类号: | G06F17/40 | 分类号: | G06F17/40 |
代理公司: | 天津佳盟知识产权代理有限公司 12002 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 模型 因素 融合 民航 旅客 出行 预测 方法 | ||
一种基于主题模型的多因素融合民航旅客出行预测方法。本发明首先构建旅客之间的关联图,并针对旅客偏好进行主题建模,进而构建旅客关联图出行主题模型(Passenger Graph based Travel Topic Model,PGTTM),能够丰富主题信息、有效解决民航数据稀疏性问题;其次通过贝叶斯概率模型构建多因素融合预测框架,融合航线热度、PGTTM得到的旅客对航线偏好、旅客忠诚度和航空公司市场占有率信息,对旅客的未来出行进行精准预测。此发明能够有效预测旅客未来出行的航空公司和航线,可为航空及相关产业提供有效的决策支持,为旅客提供个性化服务。
技术领域
本发明属于计算机应用技术领域,涉及数据挖掘和民航数据分析,特别是一种基于主题模型的多因素融合民航旅客出行预测方法。
背景技术
人们生活水平的提高、互联网的发展,使民航旅客订票系统中积累了大量订票数据,具有海量性、稀疏性、长尾性特点,给民航数据分析带来挑战。基于这些数据分析旅客出行特点、预测未来出行行为,是民航数据分析中最重要的任务之一。国内外关于民航旅客分析研究处于初步阶段,也没有对民航旅客出行预测有较多研究。
民航数据相关的分析研究例如Maalouf等对真实的航空公司频繁旅客数据应用聚类分析和关联规则等,对客户关系管理提出推荐和改善策略[1]。而王朝恩等采用问卷调查并结合统计方法,对长春民航旅客群体进行消费动机、航空公司偏好以及购买行为分析[2]。Feng等人构建民航数据上的异质信息网络,采用随机游走方式进行低频次出行旅客价值发现任务[3]。而Etzioni等探究了时间与票价之间关联性,采用一种多策略数据挖掘算法,告知旅客购买机票的最佳时间[4]。
主题模型中的LDA(Latent Dirichlet Allocation)模型有更好文本主题建模性能,具有良好扩展性[5]。如Rosen-Zvi等基于LDA提出ATM(Author-Topic Model),同时对作者、文档和词进行主题建模[6]。而Blei等针对文本分类问题提出有监督LDA模型,将训练语料中文档标记作为观测值加入LDA中[7]。拓展主题模型或LDA模型应用到推荐领域,如Liu等将旅行套餐数据中隐含特征显示加入主题模型中,提出一种个性化推荐旅游信息方法[8]。而Tan等将旅客信息表示成特征-值对形式,采用主题模型学习旅客潜在兴趣分布,并结合协同过滤进行旅行套餐推荐[9]。
旅客间社会关系有助于建模,如王琨琨等通过构建共同出行网络,提出一种旅客个体偏好和关系偏好结合的民航旅客座位偏好建模方法[10]。而周元炜等提出一个基于信息图的半监督关系分类算法,获得更为准确的旅客关系,提供针对性、高质量服务[11]。
将主题模型应用到民航旅客出行分析和预测中,发现潜在主题分布、解决数据海量性问题,是值得尝试的,以及将旅客之间的关系融入到主题建模中,丰富主题信息、减轻稀疏性问题,借此来提高建模的效果。另外通过构建概率模型框架,融合多种出行影响因素,对提高预测效果同样拭目以待。
参考文献:
[1]Maalouf L,Mansour N.Mining airline data for crm strategies.InProceeding of the 7th WSEAS International Conference on Simulation,Modelingand Optimization,Beijing,China,pages 345-350,2007.
[2]王朝恩,长春民航旅客特征与行为分析[D].吉林大学,2010.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611159984.3/2.html,转载请声明来源钻瓜专利网。