[发明专利]一种基于动态主题模型和矩阵分解的旅游景点推荐方法有效
申请号: | 201710237404.6 | 申请日: | 2017-04-12 |
公开(公告)号: | CN107133277B | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 陈岭;徐振兴 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/9535;G06Q30/06 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 主题 模型 矩阵 分解 旅游景点 推荐 方法 | ||
1.一种基于动态主题模型和矩阵分解的旅游景点推荐方法,包括:
获取数据集信息阶段:从社交网络中获取照片数据集Dphoto并对其进行去噪处理,得到旅游照片数据集Dphoto-travel,再从社交网络中获得签到数据Dcheck-in,并提取签到数据Dcheck-in中的签到地点的类别信息,得到签到地点的类别数据集Dcategory;
获得用户旅行偏爱阶段:具体步骤为:
(2-1)利用基于密度的聚类方法对旅游照片数据集Dphoto-travel中的照片进行空间聚类,获得旅游景点集合L;
(2-2)根据从旅游照片数据集Dphoto-travel统计得到的用户访问景点的次数、旅游景点集合L中的旅游景点,构建用户-景点矩阵Y;
(2-3)将文档代表用户旅行历史,词代表旅游景点,利用动态主题模型推断用户和景点在不同时间段的潜在主题概率分布,并联合所有时间段的主题概率分布,得到用户的全部隐式特征和景点的全部隐式特征
(2-4)从旅游照片数据集Dphoto-travel和签到地点的类别数据集Dcategory中提取用户的显式特征和景点的显式特征然后结合用户的全部隐式特征和景点的全部隐式特征建立用户画像Fuser和景点画像Flocation,并利用余弦函数构建m×m的用户-用户相似性矩阵A和n×n的景点-景点相似性矩阵B;
(2-5)根据建立的Y、A、以及B,利用用户-用户以及景点-景点的相似性关系构建带有联合正则项的矩阵分解模型,完成对Y的分解;
(2-6)根据带有联合正则项的矩阵分解的结果,补全稀疏的用户-景点矩阵Y,得到含有用户旅行偏爱信息的矩阵Y’;
推荐旅游景点阶段:利用矩阵Y’对候选集中的景点打分,并将打分排名前N个旅游景点推荐给用户。
2.如权利要求1所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的获取数据集信息阶段的具体步骤为:
(1-1)利用照片分享网站的公用API下载旅游城市中带有地理位置信息的照片数据,组成照片数据集Dphoto;
(1-2)利用基于熵的流动性方法对照片数据集Dphoto中的非旅游照片进行过滤,去除照片集中的噪音照片,得到旅游照片数据集Dphoto-travel;
(1-3)利用基于位置的社交媒体网站的公用API下载用户在旅游城市中的签到数据Dcheck-in;
(1-4)提取签到数据Dcheck-in中的签到地点的类别信息,并统计组成签到地点的类别数据集Dcategory。
3.如权利要求1所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的步骤(2-2)的具体步骤为:
(2-2-1)从旅游照片数据集Dphoto-travel中提取所有的访问信息v=(l,u,t),其中,v表示用户u于t时间访问旅游景点l;
(2-2-2)根据所有的访问信息v=(l,u,t)统计每个用户访问每个景点的次数和旅游照片数据集Dphoto-travel中的用户总个数m;
(2-2-3)根据每个用户访问每个景点的次数、用户总个数m以及旅游景点集合L中的共计n个旅游景点,构建用户-景点矩阵Y,其中,Y∈Rm×n,矩阵Y中(i,j)位置处的值为第i个用户访问第j个景点的次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710237404.6/1.html,转载请声明来源钻瓜专利网。