[发明专利]一种基于Spark的旅游兴趣推荐系统及推荐方法在审
申请号: | 201710496944.6 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107357845A | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 缪亚林;赵立怡 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西安弘理专利事务所61214 | 代理人: | 成丹 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 spark 旅游 兴趣 推荐 系统 方法 | ||
技术领域
本发明属于旅游技术领域,具体涉及一种基于Spark的旅游兴趣推荐系统,本发明还涉及利用上述推荐系统进行推荐的方法。
背景技术
目前,随着生活水平的提高,人们在满足物质需求的基础上,更加注重精神需求,但是,目前旅游景点商业化和旅行团跟团游存在的强制消费以及无自由时间活动等问题,使得消费者无法享受当地文化中的建筑之美,文化之美,餐饮之美。而且,目前的旅游消费体系中忽略了当地大学生的导游作用,通过私人定制旅游系统,有利于当地大学生通过兼职导游解决生活来源的问题,有利于大学生带领消费者体验纯正的当地文化,不再盲目聚集。在当前大数据的时代背景下,信息过载是消费者面临的重要问题之一,如何帮助游客在海量的数据集中获取自己不明确和难以表达的需求,筛选到满意的大学生导游是目前面临的主要问题。
在旅游推荐系统中面临的主要挑战是:数据稀疏性、冷启动以及多样性和新颖性等问题。当采用单一的推荐算法如SVD算法会存在冷启动以及维度高,计算复杂等问题,基于人口统计学的推荐方法粗糙不准确。这些推荐算法都有自己的特点和适用场景,但都无法面对复杂的旅游推荐场景。为了充分利用各种数据提供的信息,保证推荐的准确性、多样性、新颖性,旅游推荐中采用并行混合推荐算法。
传统的推荐算法运行在单机环境中,其性能受到限制,使得分析计算效率低下,存储空间扩展性能不足,为了快速响应用户的需求,推荐系统需要大数据处理的能力。目前这一领域的框架很多,其中Spark是最新一代的计算框架,大数据处理能力很强,将Spark用于大数据的离线和在线计算将大大提高推荐系统的运行效率。
发明内容
本发明的目的是提供一种基于Spark的旅游兴趣推荐系统,解决了现有推荐算法分析计算效率低下、存储空间扩展性不足的问题。
本发明的另一个目的是提供利用上述推荐系统进行推荐的方法。
本发明所采用的第一种技术方案是,一种基于Spark的旅游兴趣推荐系统,包括:
数据仓库模块,用于存储数据;
数据收集模块,将用户交互界面的数据进行收集,将收集到的数据存储到数据仓库模块中;
推荐引擎组模块,从数据仓库模块中提取数据,每个引擎都有自己的推荐策略;
结果处理模块,对推荐引擎组模块输出的结果按照权重统一起来,并将最终的结果展示给游客;
评估模块,对推荐引擎组模块的每一个引擎针对准确度和多样性进行评估,以便确定各个引擎的使用场景;
引擎管理模块,根据评估模块的结果,动态的增加、删除推荐引擎,确定各个引擎的权重;
用户反馈处理模块,将用户交互界面的用户反馈数据收集,并将收集到的反馈数据发送至数据仓库模块。
本发明第一种技术方案的特点还在于:
推荐引擎组模块包括三个推荐引擎,分别是:
基于内容的推荐,利用了大学生导游描述文件;
基于人口统计学的推荐,利用了游客描述文件;
基于SVD的推荐,利用了游客评分文件;
三个推荐引擎之间采用模块化设计,根据情况线性添加、删除及实时的调整推荐系统的权值分布。
每一个推荐引擎都分为两部分,离线计算模块和在线计算模块。
推荐引擎的离线计算模块处理数据量和计算量较大的原始数据,采用Spark分布式计算框架,供在线计算时使用。
推荐引擎的在线计算模块与具体的推荐目标相关,计算量不大,在离线计算的基础上,以最快的速度给出推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710496944.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:离群点检测方法和装置
- 下一篇:关系图谱的展示方法以及装置