[发明专利]基于改进ORAR算法的关联规则推荐系统在审
申请号: | 201610157972.0 | 申请日: | 2016-03-18 |
公开(公告)号: | CN107203566A | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | 刘陈伟;陈曙东;辛欣 | 申请(专利权)人: | 刘陈伟 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 214000 江苏省无锡市新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 orar 算法 关联 规则 推荐 系统 | ||
1.一种基于改进ORAR算法的关联规则推荐系统,其特征在于:包括数据预处理模块、1大项集生成模块、2大项集生成模块、k大项集生成模块和关联规则生成模块:
所述数据预处理模块与数据库交互,负责将数据库中的文本数据转换为可进行计算的关系矩阵;
所述1大项集生成模块、2大项集生成模块、k大项集生成模块构成ORAR算法的具体实现,负责频繁项集的生成和支持度的求解;
所述关联规则生成模块与支持度求解模块交互,负责根据支持度求解模块生成的支持度求出置信度从而转化为具体的关联规则。
2.如权利要求1所述的基于改进ORAR算法的关联规则推荐系统,其特征在于:
所述数据预处理模块需要扫描数据库,设D是事务数据库,T={t1,t2,...,tm}和I={i1,i2,...,in}分别为数据库中的交易集和项集,得到互相关矩阵
其中i=1,2,…,m,j=1,2,…,n。rij的值为1或0,分别表示第i个事务中包含或未包含第j个项;
所述1大项集生成模块、2大项集生成模块、k大项集生成模块主要针对现有的ORAR算法进行了改进,目前的ORAR算法只能在给出最小支持度阈值基础上求解频繁项集,通过判定支持度是否大于最小支持度来确定该频繁项集的保留与丢弃,但并没有将该频繁项集与其对应的支持度存储在同一名字空间内,因此难以查找各频繁项集对应的支持度,无法求解各关联规则对应的置信度及强规则;
针对以上不足,对ORAR算法进行了如下改进:
将大于支持度阈值的频繁项集的各个偏好标签与其对应的支持度存储在一个名字空间矩阵内;
在求解关联规则的置信度时,编写求解函数,根据偏好标签查找名字空间矩阵,再找出与偏好标签相匹配的支持度,代入置信度公式求解;
具体的计算步骤如下:
一、求解1-项集的支持度。对于大于支持度阈值的项目集,将偏好标签与其对应的支持度存入矩阵Aorar1=(aij)p×q(p=x,q=2)中,其中x为筛选结果行数;
二、根据求解的1-项集,将1-项集中的偏好标签两两组合(排除重复),求解2-项集的支持度。对于大于支持度阈值的项集,将组合偏好标签与其对应的支持度存入Aorar2=(aij)p×q(p=y,q=3),其中y为筛选结果行数;
三、在求解k-项集时,根据求解的1-项集和(k-1)-项集进行k阶组合,排除两种重复:项目集内部的偏好标签重复和项目集间的组合重复。对于大于支持度阈值的项目集,将组合偏好标签与其对应的支持度存入Aorark=(aij)p×q(p=z,q=k+1),其中z为筛选结果行数;
所述关联规则生成模块主要是用来根据所述支持度求解模块的结果求解出置信度从而生成相应的关联规则。具体的工作过程如下:
在置信度求解函数中,对形如的置信度求解时,从矩阵Aorar1=(aij)p×q找出X的支持度,从Aorar2=(aij)p×q中找出XY的支持度,从而求解出对形如的置信度求解时,从矩阵Aorar2=(aij)p×q中找出XY的支持度,从Aorar3=(aij)p×q中找出XYZ的支持度,从而求解出依次类推,从而求解出形如的置信度最后输出置信度大于最小置信度的强关联规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘陈伟,未经刘陈伟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610157972.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能逃生器
- 下一篇:一种折叠式手持电动洗车工具