[发明专利]一种大数据协同分析工具平台在审

专利信息
申请号: 201611227962.6 申请日: 2016-12-27
公开(公告)号: CN106649773A 公开(公告)日: 2017-05-10
发明(设计)人: 梁学东 申请(专利权)人: 北京大数有容科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京纽乐康知识产权代理事务所(普通合伙)11210 代理人: 王珂
地址: 100191 北京市海淀区塔*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 协同 分析 工具 平台
【说明书】:

技术领域

发明涉及大数据分析技术领域,具体来说,涉及一种大数据协同分析工具平台。

背景技术

现有大数据分析技术,涉及数据的从数据导入、数据存储、数据检索、数据分析、数据可视化的全流程大数据处理分析技术领域。随着大数据技术近年不断发展,也涌现了许多基于大数据的分析工具和分析平台,但由于针对业务领域不同,各家产品专攻技术差异等因素,现有大数据分析工具、BI分析工具等,仍旧存在诸多问题和缺陷。

现有技术产品大多针对商企数据提供功能技术服务,面向行业研究、科研领域的数据分析产品匮乏,现有TDA(Thomson Data Analyzer)可以面向行研数据领域,但由于不是基于大数据技术的产品,在海量数据处理、大数据分析、大数据可视化等方面功能欠缺。且大多针对单一数据源或有限数据源作为处理对象进行处理,不能兼容所有数据格式。大多支持数据导入时的ETL数据清洗处理,缺乏对数据导入ETL处理完成后的,基于业务需求的数据定制化加工标引标注。且现有技术产品不支持团队协同协作的协同数据标引和协同分析功能。只支持有限的分析算法和可视化图表来进行数据分析计算和展现数据分析结果,不支持算法包的定制化扩展以及可视化图表的模板化和插件化。

且现有技术产品的分析模式更适用于专业技术人员,不适用于真正有分析需求的业务人员,使用门槛高。且大多针对全流程的一个或几个技术领域做数据服务,缺少针对全数据流程的工具产品和数据分析技术。

针对相关技术中的问题,目前尚未提出有效的解决方案。

发明内容

本发明的目的是提供一种大数据协同分析工具平台,能够解决现有数据服务技术领域缺乏针对全数据流程的工具产品和数据分析技术的问题,填补了该领域缺乏一体化分析流程的空白。

本发明的目的通过以下技术方案来实现:

一种大数据协同分析平台,包括:

多数据源配置模块,用于实现任意数据的配置导入和爬取,建立容数据源配置XML脚本语言,或者通过容数据源配置XML脚本语言,实现各种数据源的编程配置和映射配置;

数据检索模块,用于对导入的数据建立全文分词索引,提供主题检索和条件检索,支持海量数据的高速搜索引擎;

数据加工模块,用于实现团队协同协作的协同数据标引和协同分析功能,通过标引树技术,实现标引内容的统一协同管理和数据定制化标引加工;

数据分析模块,用于定制算法模板,分析算法自由选择,量身定制数据建模和算法实现,通过算法包插件,提供专享专用算法包;

数据可视化模块,用于实现分析结果的可视化展示和自动报表,包括动态可视化插件、执行结果展示、执行结果导出和自动报告生成。

进一步的,所述多数据源配置模块包括:

网页爬取导入子模块,用于实现爬取配置、爬取规则和爬取导入的一体化处理流程,使用自主研发网络爬虫技术,对指定网站、网页进行规则化数据爬取,爬取数据根据爬虫导入配置器自动导入数据库;

数据源配置器编辑子模块,用于数据源配置器配置规则项的新建和编辑;

数据源配置器管理子模块,用于各个数据源配置器的查询和管理,包括配置器的摘要信息,详细编辑入口和删除功能;

数据导入历史管理子模块,用于针对当前任务下的数据导入历史信息列表查询,包括数据的导入名称、大小、时间、所用配置器和导入状态;

数据导入执行子模块,用于选择配置器和导入数据源执行数据导入。

进一步的,所述数据加工模块包括:

数据协同标引子模块,用于实现数据标引、加工和分析的多人团队协同

同步作业,提供在线、团队、实时、协作分析加工标引功能,各成员标引加工内容实时同步呈现,通过颜色区分不同成员的加工标引内容并相互可见,实现团队标引加工作业的操作实时协同、进度清晰可见、内容同步共享;

数据标引树管理子模块,用于提供协同标引加工时的标引数据字典功能,实现标引内容的统一协同管理和数据定制化标引加工;

标引加工执行子模块,用于数据标引、加工和分析的执行;

标引历史管理子模块,用于对标引树技术储进行管理,或者通过CSV(Comma-Separated Values,逗号分隔值)格式文件进行导入导出管理,使标引树字典信息实现线上线下的映射导出和集中管理。

进一步的,所述数据分析模块包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大数有容科技有限公司,未经北京大数有容科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611227962.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top