[发明专利]一种基于集成学习的个性化推荐方法有效
申请号: | 202110629501.6 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113326433B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 段勇;杨堃 | 申请(专利权)人: | 沈阳工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F18/243;G06F18/25;G06F18/27;G06F18/2415;G06N20/10;G06N20/20 |
代理公司: | 沈阳智龙专利事务所(普通合伙) 21115 | 代理人: | 宋铁军 |
地址: | 110870 辽宁省沈阳*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 个性化 推荐 方法 | ||
1.一种基于集成学习的个性化推荐方法,其特征在于,所述方法包括:
步骤1:分析个性化推荐数据的维度属性,将个性化推荐数据分为“用户-物品-评分”数据;将相关联的“用户-物品-评分”维度进行数据关联;
步骤2:处理完成后分析“用户-物品-评分”每个维度属性的数据类型,并将其数据类型转化为集成学习所要求的数据类型;
步骤3:根据“用户-物品-评分”维度属性中“评分”属性,进行特征属性生成;
步骤4:将所得到的所有数据进行标准化处理,计算方式如下:
其中,vv表示数据的原始数值,v′表示标准化处理后的数值,min表示vv所在列的最小值,max表示vv所在列的最大值;
步骤5:设原始空间中“用户-物品-评分”数据集A有m个样本点x1,x2,...,xm,样本点xi是一个l维向量,i取值为从1到m的整数,这m个样本按照列构成的矩阵为X;利用流行学习局部保留投影算法对该数据集A进行降维处理,降维后的数据集B为由样本点y1,y2,...,ym构成,样本点yi是一个n维向量,这m个样本按照列构成的矩阵为Y,其中l>n;
步骤6:将降维后的数据集B按照8:2的比例划分为训练集Train和测试集Test,其中训练集Train对应的数据矩阵为Y′;
步骤7:采用集成学习梯度提升决策树方法建立个性化推荐模型;
步骤8:采用贝叶斯方法优化梯度提升决策树模型参数;
步骤9:选择经过贝叶斯优化得到的最优超参组合重新训练梯度提升决策树个性化推荐模型;
步骤10:根据最终得到的个性化推荐模型在测试集上的预测结果进行Top N推荐以及效果验证。
2.根据权利要求1所述的一种基于集成学习的个性化推荐方法,其特征在于:在步骤3中,通过统计各个用户对物品评分次数,公式如下:
b代表“用户-物品-评分”数据集A中的第b个用户,数据集A中共有d个用户,R(b)为用户b针对各个物品的评分,CountRating指“每个用户评论物品次数总和”。
3.根据权利要求1所述的一种基于集成学习的个性化推荐方法,其特征在于:所述步骤5中,具体包括以下步骤:
步骤5.1:构建图,计算“用户-物品-评分”数据集A中样本xi与样本xj之外的所有的样本的欧氏距离,公式如下:
其中,ε为人工设定的阈值,取样本的均值,m为数据集中样本的总个数,如果欧氏距离小于值ε则认为两个样本很接近,则在图的节点i和节点j之建立一边;
步骤5.2:确定权重,如果节点i和节点j相连,那么它们之间的边的权重通过核热函数计算公式如下:
ωij表示节点i个节点j之间的权重,xi和xj为“用户-物品-评分”数据集A中的样本,t是人为设置的大于0的实数;
步骤5.3:计算投影矩阵,计算投影矩阵的公式如下:
XLXTa=λXDXTa (5)
假设公式中的解为a0,a1,...,al-1,且它们对应的特征值λ从小到大排序,投影变换矩阵为C=(a0,a1,...,al-1),则降维后的样本点yi=CTxi;
其中,X为步骤5提到的矩阵X,邻接矩阵W由步骤二中的权重ωij构成;对角矩阵D的主对角线是步骤一中构建的图的每个顶点带权重的度,其中节点i的带权重的度为与该节点相关的所有边的权重之和,即邻接矩阵W的每一行元素之和;普拉斯矩阵L则定义为L=D-W。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳工业大学,未经沈阳工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110629501.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可自适应关断上桥臂的同步调压器系统及控制方法
- 下一篇:一种夹具式钢筋锚固板