[发明专利]一种数据挖掘系统在审
申请号: | 201310280411.6 | 申请日: | 2013-07-04 |
公开(公告)号: | CN104281596A | 公开(公告)日: | 2015-01-14 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海朗迈网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 挖掘 系统 | ||
技术领域
本发明涉及一种数据挖掘系统。
背景技术
数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道但又是潜在有用的信息和知识的过程。
数据挖掘应用的领域很广泛,在如银行、电信、保险、交通、零售等商业领域都有着广泛的应用。数据挖掘所能解决的典型商业问题包括:数据库营销(Database Marketing)、客户群体划分(Customer Segmentation &Classification)、背景分析(ProfileAnalysis)、交叉销售(Crossselling)等市场分析行为,以及客户流失性分析(ChurnAnalysis)、客户信用记分(Credit Scoring)、欺诈发现(Fraud Detection)等等。
数据挖掘流程通常包括:数据预处理(ETL)、数据挖掘算法实现、结果展示三个主要步骤。通过ETL步骤,可对源数据进行预处理以得到待挖掘数据;通过数据挖掘算法实现步骤,可实现满足此务需要的数据挖掘算法得出分析结果;通过结果展示步骤,可将数据挖掘算法的处理结果展示给用户。
现有技术操作比较复杂,成本高、软硬件相对封闭、对厂商依赖性强,而且该方法依然采用串行的数据挖掘机制,因而其性能仍然难以较大提高。
发明内容
本发明的目的是提供一种数据挖掘系统,其可以解决现有技术中的上述缺点。
本发明采用以下技术方案:
一种数据挖掘系统,该数据挖掘系统包括数据挖掘终端,该数据挖掘终端用于挖掘网络中符合用户预设条件的数据,并且该数据挖掘终端通过总线接入该网络中,其中,该数据挖掘终端还包括:
配置模块,用于配置数据挖掘条件以及数据结构和数据类型;
识别模块,用于识别网络的物理层、链路层和应用协议层;
存储器,用于存储所配置的数据挖掘条件以及按照所配置的数据结构和数据类型存储挖掘所得的数据,其中,该配置模块分别与该识别模块和存储器相连;
程序脚本处理模块,其获取对应于不同的数据挖掘子过程的多个程序脚本,其中,一个所述数据挖掘子过程包括至少一个所述程序脚本,每个所述程序脚本具有一个对应的脚本标识,所述脚本标识用于标示该脚本标识对应的程序脚本归属的数据挖掘子过程;获取所述多个程序脚本对应的多个脚本标识;按照所述不同的数据挖掘子过程的执行顺序,确定所述多个脚本标识对应的所述多个程序脚本的调用顺序;按照确定的所述调用顺序依次调用所述多个程序脚本,进行数据挖掘;
工作流模块,用于设置数据挖掘的工作流,所述工作流中包括多个并行的挖掘算法实现处理任务;
挖掘算法实现模块,用于当所述工作流中的所述多个并行的挖掘算法实现处理任务被触发时,为其中的每个挖掘算法实现处理任务分配执行节点,以使所述多个并行的挖掘算法实现处理任务在分配的执行节点上并行执行,并处理得到相应挖掘算法实现处理任务的处理结果。
所述配置的数据挖掘条件包括条件代码、条件参数,其中,条件代码指明挖掘条件,配置的数据类型包括数据ID、字节地址、位地址和数据长度,该数据结构为链表数据结构。
所述配置的数据挖掘条件还包括与条件参数相对应的控制命令。
该存储器还包括:数据ID 存储单元,用于存储数据ID 以及数据ID 指针;
配置存储单元,用于存储字节地址、位地址和数据长度,条件代码、条件参数,以及与条件参数相对应的控制命令的控制命令指针;
控制命令存储单元,用于存储与条件参数相对应的控制命令,
其中,所述数据ID 指针指向配置存储单元中相对应的数据类型,所述控制命令指针指向控制命令存储单元中与条件参数相对应的控制命令。
该数据挖掘系统还包括控制中心,该控制中心用于发送配置指令至该数据挖掘终端以及接收该数据挖掘终端回传的挖掘所得的数据,其中,该数据挖掘终端根据该配置指令配置数据挖掘条件以及数据结构和数据类型,该数据挖掘终端还包括与配置模块相连的通信模块,该通信模块用于与该控制中心进行通信,接收来自控制中心的配置指令以及将挖掘所得的数据发送至控制中心。
本发明的优点是:本发明中采用统计分析、决策树、粗糙集、模糊集、基于范例的推理、神经网络等数据挖掘方法对信息数据集中的海量数据进行分析、处理、推理、预测,最终根据用户设定的条件,实现最优方案的自动推送。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海朗迈网络科技有限公司,未经上海朗迈网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310280411.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置