[发明专利]一种基于关联规则的数据挖掘技术在审
申请号: | 201711451848.6 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108334548A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 万迅 | 申请(专利权)人: | 爱品克科技(武汉)股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市港湾知识产权代理有限公司 44258 | 代理人: | 微嘉 |
地址: | 430000 湖北省武汉市东湖高新技术开发区*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 关联规则 数据挖掘技术 事务数据库 算法 关联规则数据 模拟实验结果 关联关系 关联矩阵 频繁项集 平台用户 数据集中 数据挖掘 挖掘算法 有效建立 关联图 有效地 遍历 转化 | ||
1.一种基于关联规则的数据挖掘技术,其技术在于,包括如下步骤:
对于现有的任意数据记录顺序,将每一条事务交易数据看成事务矩阵中的行,事务交易数据划分不同属性类别,每个属性类别作为一列,假定事务数据库D中包含M条数据记录,数据记录分为N个类别,将该事务数据库看作一个M×N的矩阵。对于任意行,如果对应的事务交易记录在矩阵列中类别属性下存在对应的项目,则矩阵中该行的这一别属性对应位置记为1,否则记为0。将事务数据库转换为事务矩阵,各个数据项存在于交易数据记录中,则矩阵中对应取值为1,否则为0,相应的各项目的矩阵A1、A2、A3、A4、A5分别是A1=[1 0 1 00]、A2=[0 1 1 1 1]、A3=[1 1 1 0 1]、A4=[1 0 0 0 0]、A5=[0 1 1 1 0],转换后事务矩阵Mij如下:
根据矩阵Mij,计算各列矩阵值之和,若满足
k为矩阵中属性Ak对应列号,aik是第k列的矩阵值,min是最小支持度计数,那么属性Ak为1阶大项集。若假设min=3,根据上面公式可得a12+a22+a32+a42+a52=4>3,故对应列属性A2为1阶大项集,同理可以得到事务数据库1阶大项集为{A2}、{A3}、{A5}。从而可以判断k阶大项集中必定不含有属性A1和A4,因此删除矩阵Mij中属性A1和A4对应列,从而在构造1阶大项集过程中就能够缩减数据规模。设{A1,A2,…,Ak}是一个k阶大项目集,如果在分矩阵中存在从属性Ak到项目Au的矩阵值相等且为1,那么项目集{A1,A2,…,Ak}可以被扩展为候选(k+1)阶项目集{A1,A2,…,Ak,Au}。得到候选项目集后,根据不同属性下矩阵值之间的运算判断是否生成(k+1)阶大项目集,即满足
aip·aiq·····aiu=1
计数器计数一次,当计数总数大于最小支持度计数时,那么{A1,A2,…,Ak,Au}即为所要挖掘的(k+1)阶大项目集,否则算法循环执行,直至全部属性列均被扩展并执行与运算后算法终止。根据2阶大项目集得到扩展的候选3阶项目集{A2,A3,A5},可在分矩阵m1查询到对应A2、A3、A5矩阵值a11、a12、a13、a21、a22、a23,由式(5)计算a11×a12×a13=1,a21×a22×a23=1,因此得到计数器计算结果为2,由于最小支持度计数为3,3阶候选项目集的支持数不满足条件,因此3阶大项集为空集,算法终止。同理根据上述方法挖掘矩阵m2,得到同样结果,因此表1数据库的k阶大项目集即为2阶大项目集{A2A3}、{A2A5}。
2.如权利要求1所述的方法,其具体算法包括如下步骤:
提出的矩阵算法主要从三个方面对挖掘过程进行了改进:(1)减少扫描的数据量。随着项集阶数的增加,候选项集个数逐渐减少,项集对应的矩阵列也逐一删除,在下一次循环矩阵操作中计算量大大减少。(2)减少扫描数据库的次数。矩阵算法仅扫描一次数据库,建立事务矩阵,得到候选项目集后,根据不同属性下矩阵值之间的运算生成(k+1)阶大项目集,每次生成大项目集只需要在上一阶大项目集对应的分矩阵基础上进行扩展即可,大大节省算法执行时间。(3)减少候选项目集的数量。在生成生成k阶大项目集时,若候选项目集计数总数小于最小支持度计数,就将其从候选项集中删除,经过这样的消减过程,产生的候选项集显著减少。不但提高算法执行效率,而且大大节约了系统的硬件存储空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱品克科技(武汉)股份有限公司,未经爱品克科技(武汉)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711451848.6/1.html,转载请声明来源钻瓜专利网。