[发明专利]一种基于加权频繁序列的商品组合挖掘方法在审
| 申请号: | 202111556654.9 | 申请日: | 2021-12-17 |
| 公开(公告)号: | CN114219574A | 公开(公告)日: | 2022-03-22 |
| 发明(设计)人: | 叶臻强;陈家辉;万世成;郭炜彬;黎梓洋;梁梓恩 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/2458 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
| 地址: | 510090 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 加权 频繁 序列 商品 组合 挖掘 方法 | ||
1.一种基于加权频繁序列的商品组合挖掘方法,其特征在于,包括:
S1:获取基于时间的商品交易的订单信息,组成商品数据集D;
商品数据集D={S1,S2,…,Sn},其中Sn表示第n段时间的订单序列,每个订单序列称为商品数据集的项集;订单序列Sn={I1,I2,…,Im},其中Im表示第m个订单,每个订单称为商品数据集的项,每个订单包含至少一个商品;
S2:根据商品的收益情况为每个商品赋予不同的权值;
S3:根据商品权值大小,对多元项中包含的商品进行排序,获得排序后的商品数据集D*;
S4:建立候选加权频繁序列集WFUBr、加权频繁序列集WSr和加权频繁项集FIr,令r=1;
S5:判断排序后的商品数据集D*是否为空,若为空,则执行步骤S10;否则,根据候选加权频繁序列集WFUBr的r序列与排序后的商品数据集D*中的一元项进行扩展,获得扩展r序列,执行步骤S6;
S6:计算扩展r序列中每个序列的加权支持上界值和加权支持度,依据向下闭包特性,确定是否将每个序列加入候选加权频繁序列集WFUBr和加权频繁序列集WSr中;并将加入候选加权频繁序列集WFUBr中的序列的项添加到加权频繁项集FIr中;
S7:根据先验性原理,利用加权频繁项集FIr中的项对排序后的商品数据集D*进行压缩,形成压缩数据集D′;
S8:基于压缩数据集D′,分别以其中的每个项为前缀,构建投影数据集Dr,将投影数据集Dr作为下一轮次的数据集D*;
S9:令r=r+1,返回步骤S5;
S10:根据每一轮次获得的加权频繁序列集组成加权频繁序列总集;
S11:根据加权频繁序列总集进行商品组合推荐。
2.根据权利要求1所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S3中,根据商品权值大小,对多元项中包含的商品进行升序排序。
3.根据权利要求2所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S5中,根据候选加权频繁序列集WFUBr的r序列与排序后的商品数据集D*中的一元项进行扩展包括项集扩展或序列扩展;
项集扩展表示将排序后的商品数据集D*中的一元项分别添加到r序列中最后一个项集的末尾;
序列扩展表示将排序后的商品数据集D*中的一元项分别添加到r序列的末尾。
4.根据权利要求3所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,计算扩展r序列的加权支持上界值的具体方法为:
式中,swubr表示扩展r序列的加权支持上界值,tsmw表示排序后的商品数据集D*的相对加权频繁总值,Sy表示第y段时间的订单序列;RUPr表示扩展r序列在所属订单序列的上界值,ωr表示扩展r序列的权值,lengthr表示扩展r序列所包含的项数,rswubr表示扩展r序列所在订单序列的剩余最大值,|X|表示添加至r序列的项的个数。
5.根据权利要求3所述的基于加权频繁序列的商品组合挖掘方法,其特征在于,所述步骤S6中,计算扩展r序列的加权支持度的具体方法为:
式中,wsupr表示扩展r序列的加权支持度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111556654.9/1.html,转载请声明来源钻瓜专利网。





