[发明专利]数据处理方法、装置、设备、存储介质及计算机程序产品在审
申请号: | 202210130479.5 | 申请日: | 2022-02-11 |
公开(公告)号: | CN114547212A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 权蕾 | 申请(专利权)人: | 中国移动通信集团陕西有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/22;G06F16/25;G06F16/2458;G06F16/26 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 桂艳球 |
地址: | 710077 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 计算机 程序 产品 | ||
本申请公开了一种数据处理方法、装置、设备、存储介质及计算机程序产品。该方法包括:获取预设区域内的待处理教育数据;所述待处理教育数据包括多种不同类型的教育数据;对所述待处理教育数据进行哈希函数的计算,得到与所述待处理教育数据对应的哈希编码;对所述哈希编码构建哈希索引;对所述哈希索引进行扫描,得到至少一个频繁项集;其中,所述频繁项集中包括至少一种类型的教育数据;基于至少一个频繁项集,生成各所述频繁项集的关联规则,以实现高效从海量教育数据中发现各类教育数据之间的关联性的效果。
技术领域
本申请属于数据处理领域,尤其涉及一种数据处理方法、装置、设备、存储介质及计算机程序产品。
背景技术
随着大数据时代的到来,对海量数据的处理成为了现在要解决的关键问题,尤其是随着人们对教育行业的高度重视,发现海量教育数据之间的关联性成为更为重要的要解决的问题。
目前发现海量教育数据之间的关联性通常是利用Aprior算法对要进行处理的大量教育数据进行逐层反复扫描,从而在海量教育数据中发现各种类型的教育数据之间的关联性。
然而,上述方式由于需要对存储海量教育数据的数据库进行逐层反复扫描,增加了读取数据库I/O口的操作次数,从而导致计算时间过长,降低了数据处理的效率。
发明内容
本申请实施例提供种数据处理方法、装置、设备、存储介质及计算机程序产品,实现高效从海量教育数据中发现各类教育数据之间的关联性的效果。
第一方面,本申请实施例提供一种数据处理方法,方法包括:
对所述待处理教育数据进行哈希函数的计算,得到与所述待处理教育数据对应的哈希编码;
对所述哈希编码构建哈希索引;
对所述哈希哈希索引进行扫描,得到至少一个频繁项集;其中,所述频繁项集中包括至少一种类型的教育数据;
基于至少一个频繁项集,生成各所述频繁项集的关联规则。
第二方面,本申请实施例提供了一种数据处理装置,装置包括:
获取模块,用于获取预设区域内的待处理教育数据;所述待处理教育数据包括多种不同类型的教育数据;
计算模块,用于对所述待处理教育数据进行哈希函数的计算,得到与所述待处理教育数据对应的哈希编码;
构建模块,用于对所述哈希编码构建哈希索引;
扫描模块,用于对所述哈希哈希索引进行扫描,得到至少一个频繁项集;其中,所述频繁项集中包括至少一种类型的教育数据;
关联规则生成模块,用于基于至少一个频繁项集,生成各所述频繁项集的关联规则。
第三方面,本申请实施例提供了一种数据处理设备,设备包括:
处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如本申请第一方面的实施例提供的数据处理方法。
第四方面,本申请实施例提供了一种计算机存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如本申请第一方面的实施例提供的数据处理方法。
第五方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如本申请第一方面的实施例提供的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团陕西有限公司;中国移动通信集团有限公司,未经中国移动通信集团陕西有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210130479.5/2.html,转载请声明来源钻瓜专利网。