[发明专利]一种基于Kubenetes集群的分布式爬虫方法和存储设备在审
| 申请号: | 202111455547.7 | 申请日: | 2021-12-01 |
| 公开(公告)号: | CN114117180A | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 张汀勇;叶章明;侯祥钦;陈天宇;郑为洛;林杰;王敏力;卞江新 | 申请(专利权)人: | 福建博思数字科技有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/27 |
| 代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 魏小霞 |
| 地址: | 350200 福建省福州市长乐*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 kubenetes 集群 分布式 爬虫 方法 存储 设备 | ||
1.一种基于Kubenetes集群的分布式爬虫方法,其特征在于,包括步骤:
构建代码仓库;
构建制品库;
构建自动化部署流程;
根据所述部署流程将制品库的镜像文件自动部署至Kubenetes的各个节点上;
启动爬虫任务进行任务采集。
2.根据权利要求1所述的一种基于Kubenetes集群的分布式爬虫方法,其特征在于,所述“构建制品库”前,具体还包括步骤:
当有修改后的代码提交至代码仓库时,对提交的代码进行自动化构建,所述自动化构建包括但不限于:代码检查、单元测试、编译构建。
3.根据权利要求1所述的一种基于Kubenetes集群的分布式爬虫方法,其特征在于,所述“构建制品库”,还包括步骤:
根据构建脚本文件进行制品库构建,所述构建脚本文件包括:多条指令;
一条指令用于指导构建一层,所述指令的内容包括但不限于:需要的操作系统、代码库、依赖的第三方包、根据环境变量灵活动态的添加一些参数来构建一个版本的制品库、版本控制和追踪。
4.根据权利要求1所述的一种基于Kubenetes集群的分布式爬虫方法,其特征在于,所述“根据所述部署流程将制品库的镜像文件自动部署至Kubenetes的各个节点上”,具体还包括步骤:
开启内部DNS实现service发现;
通过kubectl并配置连接到集群;
根据yml指令将爬虫部署在多个Node节点的多个最小的调度单元Pod上;
通过Pod控制器控制爬虫的规模。
5.根据权利要求1所述的一种基于Kubenetes集群的分布式爬虫方法,其特征在于,所述“构建自动化部署流程”,具体还包括步骤:
配置自动化部署流程,或预设触发条件,当达到触发条件时触发自动部署。
6.一种存储设备,其中存储有指令集,其特征在于,所述指令集用于执行:
构建代码仓库;
构建制品库;
构建自动化部署流程;
根据所述部署流程将制品库的镜像文件自动部署至Kubenetes的各个节点上;
启动爬虫任务进行任务采集。
7.根据权利要求6所述的一种存储设备,其特征在于,所述指令集还用于执行:
所述“构建制品库”前,具体还包括步骤:
当有修改后的代码提交至代码仓库时,对提交的代码进行自动化构建,所述自动化构建包括但不限于:代码检查、单元测试、编译构建。
8.根据权利要求6所述的一种存储设备,其特征在于,所述指令集还用于执行:所述“构建制品库”,还包括步骤:
根据构建脚本文件进行制品库构建,所述构建脚本文件包括:多条指令;
一条指令用于指导构建一层,所述指令的内容包括但不限于:需要的操作系统、代码库、依赖的第三方包、根据环境变量灵活动态的添加一些参数来构建一个版本的制品库、版本控制和追踪。
9.根据权利要求6所述的一种存储设备,其特征在于,所述指令集还用于执行:所述“根据所述部署流程将制品库的镜像文件自动部署至Kubenetes的各个节点上”,具体还包括步骤:
开启内部DNS实现service发现;
通过kubectl并配置连接到集群;
根据yml指令将爬虫部署在多个Node节点的多个最小的调度单元Pod上;
通过Pod控制器控制爬虫的规模。
10.根据权利要求6所述的一种存储设备,其特征在于,所述指令集还用于执行:所述“构建自动化部署流程”,具体还包括步骤:
配置自动化部署流程,或预设触发条件,当达到触发条件时触发自动部署。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建博思数字科技有限公司,未经福建博思数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111455547.7/1.html,转载请声明来源钻瓜专利网。





