[发明专利]一种大数据智能抽取的管理方法在审
| 申请号: | 201310445356.1 | 申请日: | 2013-09-26 |
| 公开(公告)号: | CN103473360A | 公开(公告)日: | 2013-12-25 |
| 发明(设计)人: | 邹建军;吕亚伟;赵兵旗 | 申请(专利权)人: | 浪潮齐鲁软件产业有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 250104 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 智能 抽取 管理 方法 | ||
1.一种大数据智能抽取的管理方法,其特征在于,其具体步骤为:
1)完成抽取应用的管理的步骤,该步骤是指抽取数据源的选择选用至少一个抽取工具的至少一个应用;
2)完成信息同步的步骤,该步骤是指:
一、数据抽取规则同步;
二、监控和日志信息同步;
3)完成抽取规则管理的步骤,该步骤是指对抽取规则进行格式定义,实现对抽取规则的树形、多角度分类,并对抽取规则进行分组管理;
4)规则参数管理的步骤,该步骤是指对参数进行分类管理;
5)抽取任务调度的步骤,该步骤是指通过合理设置调度阀值,在调度时,在相同的时间内,使得运行的任务数既不超过源库的传输负荷,也不会超过抽取工具服务器的抽取负荷,完成抽取任务。
2.根据权利要求1所述的一种大数据智能抽取的管理方法,其特征在于,所述信息同步的详细步骤为:在该管理应用实现时,建立一整套表结构,实现抽取工具各规则表信息到平台表信息的映射,从而屏蔽各种数据集中工具信息的差异,使得能够统一同步信息、管理规则、监控任务执行情况,以及调度任务使其执行在不同的抽取工具上进行数据抽取。
3.根据权利要求1所述的一种大数据智能抽取的管理方法,其特征在于,所述抽取规则管理步骤中的分组管理是指:按照业务系统、业务类别、数据来源信息对规则进行分组抽取和管理,对于逻辑上关联的抽取规则,定义逻辑关系,实现任务串并联管理。
4.根据权利要求1所述的一种大数据智能抽取的管理方法,其特征在于,所述规则参数管理的详细步骤为:这里的参数是指不同的抽取规则对应的不同参数,该参数从范围上分别分为全局参数、局部参数、规则参数;从参数的取值方式上,将参数分为固定值、系统值和动态值,在抽取任务出错时,快速完成对参数值的修改。
5.根据权利要求1所述的一种大数据智能抽取的管理方法,其特征在于,所述抽取任务的调度的详细步骤为:在管理应用建设时,根据数据库服务器、抽取工具服务器、网络传输速率的硬件配置情况,设置合理的阀值;在任务启动时,根据硬件环境合理的启动并行的任务数;对执行出错的任务,根据不同的错误类型,进行不同的应对处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮齐鲁软件产业有限公司,未经浪潮齐鲁软件产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310445356.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提早桑树冬芽萌发的方法
- 下一篇:一种氢溴酸普拉格雷醋酸合物的制备方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





