[发明专利]一种基于知识图谱与蚁群算法的旅游路线推荐方法有效

申请号：	202110342236.3	申请日：	2021-03-30
公开（公告）号：	CN113112058B	公开（公告）日：	2023-07-18
发明（设计）人：	王磊;郑伟	申请（专利权）人：	西安理工大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q50/14;G06F16/29;G06F16/36;G06F16/9536;G06F16/9537;G06N3/006
代理公司：	西安弘理专利事务所 61214	代理人：	宁文涛
地址：	710048 陕***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于知识图谱算法旅游路线推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于知识图谱与蚁群算法的旅游路线推荐方法，其特征在于，具体按照如下步骤实施：

步骤1，构建旅游知识图谱；具体为：

步骤1.1，获取各个旅游出行网站上的景点数据，获取信息包括景点名称、景点级别、景点评分、景点地址、景点开放时间、景点官方网址、景点官方联系方式、景点参考用时；

步骤1.2，将步骤1.1从各个旅游出行网站获取到的多源数据通过Python中Synonyms中文近义词工具包进行融合，首先两两判断不同网站景点数据集中的景点名称是否相似，假设从网站1与网站2获得了相对应的数据集1与数据集2，从数据集2中取一个景点数据S₁，将其景点名称与数据集1中所有景点的景点名称进行相似度比较，若相似度值都小于0.7，说明数据集1中不包含景点数据S₁，将景点数据S₁的所有数据并入数据集1中，包括景点名称、景点级别、景点评分、景点地址、景点开放时间、景点官方网址、景点官方联系方式、景点参考用时，若相似度值大于0.7，假设景点数据S₁的景点名称与数据集1中景点数据P₁的景点名称计算相似度后相似度值大于0.7，说明S₁与P₁是一个景点，然后比较S₁与P₁的景点属性，景点属性就是指景点级别、景点评分、景点地址、景点开放时间、景点官方网址、景点官方联系方式、景点参考用时，依次从S₁中取出一个景点属性与P₁的所有景点属性进行相似度比较，若相似度大于0.7，则不进行操作，若相似度大于0.7，则将该属性补充入P₁，并补充该属性所对应属性值，这里的属性值指的是景点属性对应的数据，然后再从数据集2中取出景点数据S₂重复上述步骤，以此类推，最后的数据集1融合了数据集2中的数据；

步骤1.3，对步骤1.2中融合好的景点数据，使用中文通用百科知识图谱CN-Dbpedia中的API“api/cndbpedia/value”获取景点的类型，其请求参数需要包括实体名称与属性名称，其中实体名称即为融合后数据集中的景点名称，属性名称为字符串“CATEGORY_ZH”，依次对融合后数据集中的景点调用API即可获得所对应的景点类型；

步骤1.4，将步骤1.3最终处理好的数据整理成三元组的形式，三元组形式为头实体，关系，尾实体，其中，头实体为景点名称，关系为景点属性，尾实体为对应属性值，景点属性即景点级别、景点评分、景点地址、景点开放时间、景点官方网址、景点官方联系方式、景点参考用时，属性值即其对应的数据；

步骤1.5，将步骤1.4中处理好的三元组存储入neo4j图数据库中，构成旅游知识图谱；

步骤2，获取用户游记数据集，对数据进行去噪，分词与景点匹配后得到最终有效的路线数据集；

步骤3，基于步骤1构建的知识图谱，将用户的历史数据作为兴趣起点在图谱中挖掘用户兴趣方向上的候选景点并获取候选景点的评分与参考用时；

步骤4，对步骤2获得的路线数据集进行预处理，计算景点间的转移率并建立转移率矩阵，具体为：

步骤4.1，计算景点间的转移率trans(v_i)，如公式(1)所示：

其中，count(v_i-1,v_i)为在所有的历史轨迹中连续访问景点v_i-1和景点v_i的次数，count(v_i-1)为从景点v_i-1发生转移的总次数；

步骤4.2，建立二维矩阵，行列均为所有候选景点，将转移率填入矩阵中，得到转移率矩阵；

计算景点在路线中的出现频率并制作景点频率表，具体为：

步骤4.3，计算景点在路线中出现的频率fre(v_i)，如公式(2)所示：

其中，num(v_i)为在所有的历史轨迹中景点v_i出现的次数，num_allspot为所有景点出现的次数；

步骤4.4，建立一维数组，长度为候选景点数量且与景点名称一一对应，将景点频率填入数组，得到景点频率表；

步骤5，查询候选景点间的最短通行时间，建立通行时间矩阵；

步骤6，基于步骤3、步骤4及步骤5的数据，利用蚁群算法进行优化，得出最优解路线，将其作为结果推荐给用户；具体为：

步骤6.1，对蚂蚁算法的参数进行初始化，具体为：信息素重要程度因子α设置为1，启发函数重要程度因子β设置为2.0，信息素挥发因子ρ设置为0.5，信息素释放总量Q设置为100，蚁群规模u设置为候选景点的数量n，建立n×n的矩阵p_g记录景点之间的信息素且所有景点间路径的信息素设置为1，当前最优路线得分S初始为0；

步骤6.2，设定标模型为：

目标：路线得分S最大；

条件：路线总用时不大于用户最大时间限制T_max；

建立单目标优化模型如下目标函数：

其中，value(v_i)为景点对用户的价值度，其计算方法：

T_traffic(v_i-1,v_i)是景点v_i到景点v_i-1的交通用时，T_visit(v_i)是景点v_i的景点参考用时，T_traffic(v₀,v₁)＝0，grade(v_i)为景点得分等级，其计算方法为公式(5):