[发明专利]一种大数据协同分析工具平台在审
申请号: | 201611227962.6 | 申请日: | 2016-12-27 |
公开(公告)号: | CN106649773A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 梁学东 | 申请(专利权)人: | 北京大数有容科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙)11210 | 代理人: | 王珂 |
地址: | 100191 北京市海淀区塔*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 协同 分析 工具 平台 | ||
技术领域
本发明涉及大数据分析技术领域,具体来说,涉及一种大数据协同分析工具平台。
背景技术
现有大数据分析技术,涉及数据的从数据导入、数据存储、数据检索、数据分析、数据可视化的全流程大数据处理分析技术领域。随着大数据技术近年不断发展,也涌现了许多基于大数据的分析工具和分析平台,但由于针对业务领域不同,各家产品专攻技术差异等因素,现有大数据分析工具、BI分析工具等,仍旧存在诸多问题和缺陷。
现有技术产品大多针对商企数据提供功能技术服务,面向行业研究、科研领域的数据分析产品匮乏,现有TDA(Thomson Data Analyzer)可以面向行研数据领域,但由于不是基于大数据技术的产品,在海量数据处理、大数据分析、大数据可视化等方面功能欠缺。且大多针对单一数据源或有限数据源作为处理对象进行处理,不能兼容所有数据格式。大多支持数据导入时的ETL数据清洗处理,缺乏对数据导入ETL处理完成后的,基于业务需求的数据定制化加工标引标注。且现有技术产品不支持团队协同协作的协同数据标引和协同分析功能。只支持有限的分析算法和可视化图表来进行数据分析计算和展现数据分析结果,不支持算法包的定制化扩展以及可视化图表的模板化和插件化。
且现有技术产品的分析模式更适用于专业技术人员,不适用于真正有分析需求的业务人员,使用门槛高。且大多针对全流程的一个或几个技术领域做数据服务,缺少针对全数据流程的工具产品和数据分析技术。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
本发明的目的是提供一种大数据协同分析工具平台,能够解决现有数据服务技术领域缺乏针对全数据流程的工具产品和数据分析技术的问题,填补了该领域缺乏一体化分析流程的空白。
本发明的目的通过以下技术方案来实现:
一种大数据协同分析平台,包括:
多数据源配置模块,用于实现任意数据的配置导入和爬取,建立容数据源配置XML脚本语言,或者通过容数据源配置XML脚本语言,实现各种数据源的编程配置和映射配置;
数据检索模块,用于对导入的数据建立全文分词索引,提供主题检索和条件检索,支持海量数据的高速搜索引擎;
数据加工模块,用于实现团队协同协作的协同数据标引和协同分析功能,通过标引树技术,实现标引内容的统一协同管理和数据定制化标引加工;
数据分析模块,用于定制算法模板,分析算法自由选择,量身定制数据建模和算法实现,通过算法包插件,提供专享专用算法包;
数据可视化模块,用于实现分析结果的可视化展示和自动报表,包括动态可视化插件、执行结果展示、执行结果导出和自动报告生成。
进一步的,所述多数据源配置模块包括:
网页爬取导入子模块,用于实现爬取配置、爬取规则和爬取导入的一体化处理流程,使用自主研发网络爬虫技术,对指定网站、网页进行规则化数据爬取,爬取数据根据爬虫导入配置器自动导入数据库;
数据源配置器编辑子模块,用于数据源配置器配置规则项的新建和编辑;
数据源配置器管理子模块,用于各个数据源配置器的查询和管理,包括配置器的摘要信息,详细编辑入口和删除功能;
数据导入历史管理子模块,用于针对当前任务下的数据导入历史信息列表查询,包括数据的导入名称、大小、时间、所用配置器和导入状态;
数据导入执行子模块,用于选择配置器和导入数据源执行数据导入。
进一步的,所述数据加工模块包括:
数据协同标引子模块,用于实现数据标引、加工和分析的多人团队协同
同步作业,提供在线、团队、实时、协作分析加工标引功能,各成员标引加工内容实时同步呈现,通过颜色区分不同成员的加工标引内容并相互可见,实现团队标引加工作业的操作实时协同、进度清晰可见、内容同步共享;
数据标引树管理子模块,用于提供协同标引加工时的标引数据字典功能,实现标引内容的统一协同管理和数据定制化标引加工;
标引加工执行子模块,用于数据标引、加工和分析的执行;
标引历史管理子模块,用于对标引树技术储进行管理,或者通过CSV(Comma-Separated Values,逗号分隔值)格式文件进行导入导出管理,使标引树字典信息实现线上线下的映射导出和集中管理。
进一步的,所述数据分析模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大数有容科技有限公司,未经北京大数有容科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611227962.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种访问数据的方法及设备
- 下一篇:基于人工智能的对象推送方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置