[发明专利]一种数据挖掘方法、装置、服务器及计算机可读存储介质有效

专利信息
申请号: 201711144782.6 申请日: 2017-11-17
公开(公告)号: CN107832440B 公开(公告)日: 2020-10-13
发明(设计)人: 谢永恒;谭罗乐;火一莽;万月亮 申请(专利权)人: 北京锐安科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/25;G06F16/27
代理公司: 北京品源专利代理有限公司 11332 代理人: 孟金喆
地址: 100044 北京市海淀区西小口*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 挖掘 方法 装置 服务器 计算机 可读 存储 介质
【说明书】:

发明公开一种数据挖掘方法、装置、服务器及计算机可读存储介质,该数据挖掘方法包括:从HDFS中获取原始数据;提取所述原始数据中的对象信息及对象关系信息;将提取的对象信息及对象关系信息存储到Hbase中;基于存储的对象信息及对象关系信息挖掘关系数据。本发明的技术方案解决了现有数据挖掘过程对内存及网络带宽配置要求较高的问题,在内存配置不高、低于万兆网卡的配置集群上即可实现快速的关系数据挖掘,降低了实现成本。

技术领域

本发明实施例涉及大数据和数据挖掘技术领域,尤其涉及一种数据挖掘方法、装置、服务器及计算机可读存储介质。

背景技术

目前,随着计算机和网络应用的日益广泛以及不同领域的业务种类的日益丰富,从大数据中快速有效地挖掘所需数据越来越重要,例如,从与特定的对象相关的海量数据记录中快速有效地挖掘出不同类别的对象或者在某些方面相关联的对象(即有同一关系的对象)。

在大数据平台的实际应用中经常出现的业务就是对数据进行同一关系的处理,比如发现某人所有的好友,而这些数据零散的存在于大数据系统中,如何把这些零散的数据归并到同一关系中是大数据处理经常遇到的问题。

目前,对于数据进行同一关系的运算处理一般都是采用Spark中的GraphX进行图计算,然后输出计算结果。然而,使用Spark进行计算虽然有诸多便利,但是其对内存和网络带宽要求颇高,Spark官网推荐的网卡是万M的网卡,不太适合一些低配的集群;而使用Neo4j进行运算,其开源版存储量有限,不能满足海量数据的存储需求。

发明内容

本发明提供一种数据挖掘方法、装置、服务器及计算机可读存储介质,该数据挖掘方法适合在内存配置不高,低于万兆网卡的配置集群上使用,以降低成本,解决了现有大数据挖掘过程对内存及网络带宽配置要求较高的问题。

第一方面,本发明实施例提供了一种数据挖掘方法,包括:

从HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)中获取原始数据;

提取所述原始数据中的对象信息及对象关系信息;

将提取的对象信息及对象关系信息存储到Hbase(Hadoop Database,Hadoop数据库)中;

基于存储的对象信息及对象关系信息挖掘关系数据。

第二方面,本发明实施例还提供了一种数据挖掘装置,包括:

数据获取模块,用于从HDFS中获取原始数据;

信息提取模块,用于提取所述原始数据中的对象信息及对象关系信息;

信息存储模块,用于将提取的对象信息及对象关系信息存储到Hbase中;

数据挖掘模块,基于存储的对象信息及对象关系信息挖掘关系数据。

第三方面,本发明实施例还提供了一种服务器,所述服务器包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的数据挖掘方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的数据挖掘方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711144782.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top