[发明专利]一种面向多用户协作的数据挖掘平台的构建方法有效

专利信息
申请号: 201410059806.8 申请日: 2014-02-21
公开(公告)号: CN103853821B 公开(公告)日: 2017-02-22
发明(设计)人: 叶枫;郭小成;李源畅;范仕良 申请(专利权)人: 河海大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京苏高专利商标事务所(普通合伙)32204 代理人: 李玉平
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种面向多用户协作的数据挖掘平台的构建方法,该方法集成了弹性工作流、多用户协作机制,提供了面向数据采集人员、数据分析人员和结果审查人员三种用户角色协作进行数据挖掘的工作空间,整个工作流程以构件来实现,包括数据采集构件、数据预处理构件、数据建模构件、结果可视化显示构件和模型评估构件。不同的用户角色可以在不同的用户视图里以拖拽的方式建立和操纵由构件和箭头组成的弹性工作流。针对数据挖掘不断重复、不断修改、不断迭代的复杂性,本发明不仅可以极大的简化数据挖掘工作,还可以防止数据的外泄,保证数据的安全性。
搜索关键词: 一种 面向 多用户 协作 数据 挖掘 平台 构建 方法
【主权项】:
一种面向多用户协作的数据挖掘平台的构建方法,其特征在于:提供一种面向数据采集人员、数据分析人员和结果审查人员三种用户角色协作进行数据挖掘的工作空间,具体包括以下步骤:步骤1:设计并实现数据采集构件:在以下两种情况下进行数据采集:在数据库中采集数据和web上传方式采集数据;在数据库中采集数据,通过Java数据库连接实现,将数据挖掘平台的数据访问实时地转化为数据库中相应的数据查询;Web上传方式采集数据,通过监听web客户端的数据上传请求,建立客户端和数据存储服务器的socket连接,再使用Java I/O流将数据集写入到数据存储服务器的文件系统中;在两种数据采集构件具体实现时,都需将数据集相应的数据的元数据信息保存到系统的数据库中,并对外提供统一的访问接口;步骤2:设计并实现数据预处理构件:通过R语言对数据集进行统计分析,以图形的方式向用户展现数据集的基本描述信息;封装插值填补、记录去除和数据修正的数学方法,提供处理数据缺失值、处理重复数据、处理噪声数据和处理异常数据的数据预处理环节的用户接口;步骤3:设计并实现数据建模构件:通过R语言封装分类、聚类、关联和时间序列的数据挖掘模型;提供图形界面接口给用户设置相应的模型分析参数;步骤4:设计并实现结果可视化显示构件:通过R语言将数据挖掘结果和模型评估结果以图形、列表的方式展现给用户;通过Ajax轮询技术将结果实时推送给结果审查人员;步骤5:设计并实现模型评估构件:通过使用R语言提供精确率、误差率和混淆矩阵的多种模型评估方法;提供将模型分析参数和模型元数据信息保存到系统数据库的用户接口;步骤6:设计并实现用户工作空间:通过JQuery实现一个拖拽式的图形操作界面,包括构件候选流程构件区和流程创建区两个部分;通过堆栈数据结构存储用户操作日志,提供撤销、重做和保存工作空间的用户接口;步骤7:定义并实现数据挖掘流程:以步骤1至步骤5设计的数据挖掘构件为节点,定义由若干个节点和箭头组成的工作流;提供调整节点执行参数、更改流程执行方向以及导出中间运算结果的用户接口;步骤8:集成和部署挖掘平台:对步骤1至步骤5设计的数据挖掘构件提供JSON格式的配置接口,提供以编辑配置文件的方式定制挖掘平台的功能的用户接口。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410059806.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top