[发明专利]高维度大数据的关联规则分析方法、分析装置及存储介质在审
申请号: | 202210581633.0 | 申请日: | 2022-05-26 |
公开(公告)号: | CN114840582A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 张亚龙;郁炜 | 申请(专利权)人: | 衢州学院 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/21 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 郑磊 |
地址: | 324000 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 维度 数据 关联 规则 分析 方法 装置 存储 介质 | ||
本发明公开了一种高维度大数据的关联规则分析方法、分析装置及存储介质,所述方法包括:获取高维度大数据;对所述高维度大数据进行预处理,获得预处理后大数据;基于所述预处理后大数据确定多个频繁项集;计算确定每个所述频繁项集的置信度;基于所述置信度确定所述高维度大数据的关联规则。通过在对高维度大数据进行关联规则分析时,首先进行降维优化处理,然后对频繁项集的置信度进行评估和分析,从而精确确定高维度大数据的关联规则,提高了分析效率和分析精确性。
技术领域
本发明涉及数据处理领域,具体地涉及一种高维度大数据的关联规则分析方法、一种高维度大数据的关联规则分析装置以及一种计算机可读存储介质。
背景技术
随着科学技术的不断发展,人们生活变得越来越集中化,在城市的发展过程中,人们的生活数据也越来越集中化,由此催生了大数据。
为了给人们提供更好的服务,技术人员期望对人们生活的大数据进行分析,以获得对服务进行优化或改进的数据基础,例如在交通事故成因分析、气象预测关联分析、基于兴趣的实时新闻推荐、银行营销方案推荐、电子商务搭配购买推荐、购物篮分析等应用场景被广泛应用。
在现有的大数据分析技术中,主要通过对大数据中每个数据之间的关联规则进行分析和挖掘,以进行数据分析工作,现有的关联规则挖掘方法主要包括基于精确算法的方法以及基于启发式算法的方法,然而在实际应用过程中:
基于精确算法的方法在面对高维海量大数据时,时间复杂度与存储空间的爆炸将导致计算时间的大量增加以及存储空间的极大占用,因此无法满足实际需求;
基于启发式算法的方法所能处理的数据集维度以及事物数量均较小,而虽然该方法能够在一定程度上提高处理数据的维度,但其精确性低于基于精确算法的方法,因此依然无法满足实际的大数据计算需求。
发明内容
为了克服现有技术中存在的上述技术问题,本发明实施例提供一种高维度大数据的关联规则分析方法,通过在对高维度大数据进行关联规则分析时,首先进行降维优化处理,然后对频繁项集的置信度进行评估和分析,从而精确确定高维度大数据的关联规则,提高了分析效率和分析精确性。
为了实现上述目的,本发明实施例提供一种高维度大数据的关联规则分析方法,所述方法包括:获取高维度大数据;对所述高维度大数据进行预处理,获得预处理后大数据;基于所述预处理后大数据确定多个频繁项集;计算确定每个频繁项集的置信度;基于每个频繁项集的置信度确定所述高维度大数据的关联规则。
优选地,所述对所述高维度大数据进行预处理,获得预处理后大数据,包括:对所述高维度大数据执行第一降维处理,获得第一处理后数据;确定所述第一处理后数据中两两数据之间的关联度;基于所述关联度对所述第一处理后数据执行第二降维处理,获得所述预处理后大数据。
优选地,所述基于所述预处理后大数据确定多个频繁项集,包括:根据所述处理后大数据确定多个子项集;计算确定每个子项集在预设事务范围内出现的第一出现概率;依次判断每个第一出现概率是否大于预设概率阈值;将第一出现概率大于所述预设概率阈值对应的子项集作为频繁项集。
优选地,所述计算确定每个所述频繁项集的置信度,包括:在所述频繁项集中确定第一计算数据和第二计算数据;计算确定所述第一计算数据和所述第二计算数据同时在所述预设事务范围内出现的第二出现概率;基于所述第二出现概率以及所述第一计算数据对应的第一出现概率,计算确定所述第一计算数据对应于所述第二计算数据的置信度。
优选地,所述基于所述置信度确定所述高维度大数据的关联规则,包括:获取预设置信度限值;依次判断每个所述频繁项集的置信度是否大于所述预设置信度限值;根据判断结果获取大于所述预设置信度限值的合格置信度;基于所述合格置信度确定对应频繁项集的初始关联规则;基于所述初始关联规则确定所述高维度大数据的关联规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于衢州学院,未经衢州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210581633.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多模型联邦学习方法、系统及存储介质
- 下一篇:一种马桶排污用法兰
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置