[发明专利]一种分布式大数据采集分析处理方法及系统在审

申请号：	202210082415.2	申请日：	2022-01-24
公开（公告）号：	CN114490609A	公开（公告）日：	2022-05-13
发明（设计）人：	徐恒炜	申请（专利权）人：	苏州梓川信息科技有限公司
主分类号：	G06F16/215	分类号：	G06F16/215;G06F16/22;G06F16/2455;G06Q40/06;G06N3/04
代理公司：	温州市品创专利商标代理事务所(普通合伙) 33247	代理人：	吴海云
地址：	215011 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种分布式数据采集分析处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种分布式大数据采集分析处理方法，其特征在于，包括如下步骤：

步骤1，采集基金平台上的所有数据集中进入数据缓冲池；

步骤2，通过数据处理模块对数据缓存池中的原始数据进行筛选，去除杂质数据，将原始数据引入到数据资源库中形成资源数据；

步骤3，通过数据分类标记模块对数据资源库中的资源数据进行分类和序列标签化，然后对应的存储到数据索引池中。

2.如权利要求1所述的一种分布式大数据采集分析处理方法，其特征在于：步骤3数据分类标记模块对数据资源库中的资源数据进行分类和序列标签化，然后对应的存储到数据索引池中，具体步骤为：首先，数据资源库中建立有数据容器，数据容器中建立数据标签模型,然后再建立数据分析引擎，通过建立数据分析引擎连通有数据容器中建立数据标签模型，最后通过数据分析引擎对数据容器中数据模型进行重构及运算得到宏观大数据及微观数据集。

3.一种分布式大数据采集分析处理系统，其特征在于：包括

数据缓冲池，用于采集基金平台上的所有数据；

数据处理模块，用于对所述数据缓冲中的所有数据进行处理进入到数据资源库；

数据分类标记模块，用于对数据资源库资源数据进行分类和序列标签化，然后对应的存储到数据索引池中。

4.如权利要求3所述的一种分布式大数据采集分析处理方法，其特征在于：所述数据资源库中建立有数据容器，数据容器中建立数据标签模型。

5.如权利要求4所述的一种分布式大数据采集分析处理方法，其特征在于：还包括建立数据分析引擎，通过建立所述数据分析引擎连通有数据容器中建立数据标签模型，通过所述数据分析引擎对数据容器中数据模型进行重构及运算得到宏观大数据及微观数据集。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州梓川信息科技有限公司，未经苏州梓川信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210082415.2/1.html，转载请声明来源钻瓜专利网。