[发明专利]一种基于特征挖掘算法的个性化出行路线推荐方法在审
申请号: | 202110584507.6 | 申请日: | 2021-05-27 |
公开(公告)号: | CN114020993A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 华翔;张杰韬;石成泷;白飞宗;李宝华;傅妍芳 | 申请(专利权)人: | 西安工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9537 |
代理公司: | 西安赛嘉知识产权代理事务所(普通合伙) 61275 | 代理人: | 王伟超 |
地址: | 710021 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 挖掘 算法 个性化 出行 路线 推荐 方法 | ||
1.一种基于特征挖掘算法的个性化出行路线推荐方法,其特征在于,包括如下步骤:
步骤一、搜集用户基本信息,建立用户数据信息数据库;
步骤二、对用户的信息进行分析,建立用户特征模型;
步骤三、为用户推荐个性化出行路线。
2.如权利要求1所述的一种基于特征挖掘算法的个性化出行路线推荐方法,其特征在于:所述步骤一、搜集的用户基本信息包括记录用户出行车辆路线、用户个人信息、环境信息。
3.如权利要求1所述的一种基于特征挖掘算法的个性化出行路线推荐方法,其特征在于:所述步骤二、对用户的信息进行分析,建立用户特征模型的具体过程是:
步骤1、将收集到的数据信息划分m个不相关的数据块,并发送到n个节点中;通过公示(1)产生全局的候选频繁项集
式中:设Op为全局的候选频繁项集;∑z为数据格式化因子;m*n为将m划分为n个不相关的数据块;x为局部频繁项集;
步骤2、通过公示(2)计算数据中每个候选频繁项的支持频度,并按照支持度降序排列;
Support(Ai=B)=P(Ai∪B) (2)
式中:每种情况发生的次数为Ai,总数据库为B;
步骤3、利用得到的项头表和排序后的数据建立数据集,根据输出结果,产生相关关联,对数据库中的每一个操作进行分割,计算公式为:
式中:P为出行路线信息输出结果;Z代表满足条件的数据;S1,S2分别代表出行路线信息,代表了出行路线信息输出过程。
4.如权利要求1所述的一种基于特征挖掘算法的个性化出行路线推荐方法,其特征在于:所述步骤三、为用户推荐个性化出行路线是用户出行路线数据来调整路线和权重,改变推荐算法结果,计算公式如下:
式中:Q代表用户信息;Kn代表用户感兴趣度;g为路线推荐权重,|z|为推荐算法优化因子,利用上述公式,不断重复计算生成新的出行路线,直至生成满意的结果。
5.如权利要求2所述的一种基于特征挖掘算法的个性化出行路线推荐方法,其特征在于:所述记录用户出行车辆路线的方式有两种记录方式:第一种为人工记录方式,用户通过系统将走过的符合喜好的路线直接记录保存;第二种方式为机器记录方式,系统检测到用户近期常走路线并将其自动记录。
6.如权利要求5所述的一种基于特征挖掘算法的个性化出行路线推荐方法,其特征在于:对所述人工记录的路线数据进行自学习,从中分析出用户的行车习惯及路线偏好特征,利用稀疏自编码器,从大量的数据中提取出用户行车习惯的特征,学习到更多数据的隐含特征;其步骤如下:
(1)设置学习率、稀疏参数、迭代次数、神经元个数等参数,随机初始化权重w和偏置b,提取数据特征量,对数据库中保存的人工记录路线数据提取时间、路程、红绿灯、道路类别四种特征量;
(2)对于四种特征量,作为稀疏自编码器的输入进行前向传递,获得四种路线特征量内在特征信息的稀疏性表达,保存训练结束后的稀疏自编码器的权重w1和偏置b1;
(3)将得到的权重w1和偏置b1初始化神经网络的输入层和隐含层,重新设置神经网络,将人工记录路线数据作为训练样本,训练神经网络,提取特征,然后训练下一层,逐层训练;
(4)利用提取的训练集特征,将其送入特征分类器,实现一个特征的分类;将用户特征存入“兴趣数据库”,从而达到通过自学习的方法,分析出用户记录路线,提取出用户个人习惯、行车喜好等特征。
7.如权利要求1所述的一种基于特征挖掘算法的个性化出行路线推荐方法,其特征在于:返程路线的确定方法,包括如下步骤:
(a)确定需要分析的数据,确定出行路线中的关键特征信息的参考数列和特征信息的比较数列;反映用户去程路线关键特征信息的数据序列,称为参考数列;影响返程路线推荐因素组成的数据序列,称比较数列;设参考序列为Z=Z(k)|k=1,2...n;比较序列为X=X(k)|k=1,2...n;
(b)由于系统中各因素的物理意义不同,导致路线数据的量纲也可能不同,不便于相比较,于是为了减少路线数据的绝对数值的差异,将它们统一到近似的范围内,进行归一化处理;本文采用初值化处理,公式如下:
其中K对应时间段,i对应比较数列中的一行(即一个特征);
(c)计算关联系数,设i为路线数据上一个固定的特征值,也就是说对于某一个路线数据的因素,其中的每个维度进行计算,得到一个新的数据序列,这个序列中的每个值就代表着该返程路线序列中的特征值与去程路线序列中对应维度上的关联性(数字越大,代表关联性越强),公式如下:
(d)关联度的计算,形成一个路线特征关联序列,关联系数是用户去程路线关键特征信息序列与返程路线推荐因素序列在各个时刻的关联程度值,所以它的数不止一个,因此将多个时刻的关联系数集中起来,即求其平均值,作为去程路线关键特征信息序列与返程路线推荐因素序列的数量表示,公式如下:
关联度的排序,通过以上公式,将计算出来的路线特征信息进行关联度排序,找出去程路线中各个关键特征点的最优关联数据信息,关联度越大,该返程推荐的路线与去程路线标准越相似。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工业大学,未经西安工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110584507.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体元件及其制备方法
- 下一篇:具有用于切割页张的激光器的正反面印刷机