[发明专利]一种挖掘正负序列规则的方法在审
| 申请号: | 201810752109.9 | 申请日: | 2018-07-10 |
| 公开(公告)号: | CN109146542A | 公开(公告)日: | 2019-01-04 |
| 发明(设计)人: | 董祥军;蒋晓琦 | 申请(专利权)人: | 齐鲁工业大学 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
| 地址: | 250353 山东省济南*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 正负序列 序列规则 挖掘 正序列 顾客购买行为 序列数据库 购买商品 购物行为 模式生成 商品购买 序列模式 用户定义 负相关 正相关 支持度 置信度 前键 筛选 顾客 购买 | ||
1.一种挖掘正负序列规则的方法,其特征在于包括如下步骤:
S100、对序列数据库进行挖掘,得到正负序列模式,上述正负序列模式包括正序列模式和负序列模式;
S200、通过上述正负序列模式生成正负序列规则,所述正负序列规则包括正序列规则和负序列规则,所述负序列规则的前键和后键中均能够包含负元素;
S300、基于序列规则的支持度、相关性以及置信度对上述正负序列规则中的每个序列规则依次进行筛选,得到满足用户定义需求的正负序列规则。
2.根据权利要求1所述的一种挖掘正负序列规则的方法,其特征在于在执行步骤S100之前,进行数据处理,数据处理包括将客户的交易数据以时间为序进行转变生成序列数据库。
3.根据权利要求1所述的一种挖掘正负序列规则的方法,其特征在于步骤S100中通过e-NSP算法对序列数据库进行挖掘,包括如下步骤:
S110、通过传统的正序列模式挖掘算法挖掘所有的正序列模式,并计算正序列模式的支持度;
S120、基于上述正序列模式生成负序列模式;
S130、通过将负序列模式转换为正序列模式计算负序列模式的支持度。
4.根据权利要求3所述的一种挖掘正负序列规则的方法,其特征在于通过哈希表存储上述正负序列模式以及正负序列模式的支持度,哈希表的key值用于存储上述正负序列模式,哈希表的value值用于存储上述正负序列的支持度。
5.根据权利要求3所述的一种挖掘正负序列规则的方法,其特征在于步骤S200中,对正负序列模式进行判断选择,如果该正负序列模式的大小大于1,通过上述正负序列模式生成正负序列规则。
6.根据权利要求5所述的一种挖掘正负序列规则的方法,其特征在于在执行步骤S300之前,判断正负序列规则中每个序列规则的前键和后键是否频繁,并将正负序列规则中前键和后键不频繁的序列规则删除。
7.根据权利要求6所述的一种挖掘正负序列规则的方法,其特征在于步骤S300中基于序列规则的支持度、相关性以及置信度对序列规则进行筛选的步骤包括:
S310、计算当前序列规则的支持度,如果当前序列规则的支持度小于用户给定的最小支持度,删除当前序列规则,否则,保留当前序列规则并执行步骤S320;
S320、计算当前序列规则的置信度;
S330、计算当前序列规则的相关性,如果当前序列规则的相关性等于1或小于1,删除当前序列规则,否则,保留当前序列规则并执行步骤S340;
S340、计算当前序列规则的归一化后的置信度,如果当前序列规则的归一化后的置信度小于用户定义的最小置信度,删除当前序列规则,否则,保留当前序列规则。
8.根据权利要求7所述的一种挖掘正负序列规则的方法,其特征在于步骤S310中序列规则的支持度的计算公式为:
sup(X→Y)=(X∞Y)/|D|
其中,X∞Y表示包含元素X和元素Y的序列的集合的数量,|D|表示序列数据库中序列的总数。
9.根据权利要求8所述的一种挖掘正负序列规则的方法,其特征在于步骤S320中序列规则的置信度的计算公式为:
conf(X→Y)=sup(X∞Y)/sup(X);
步骤S340中序列规则的归一化后的置信度的计算公式为:
nor-conf(X→Y)=conf(X∞Y)/max(confidence)。
10.根据权利要求9所述的一种挖掘正负序列规则的方法,其特征在于步骤S330中序列规则的相关性的计算公式为:
corr(X→Y)=sup(X∞Y)/sup(X)/sup(Y)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810752109.9/1.html,转载请声明来源钻瓜专利网。





