专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果4848834个,建议您升级VIP下载更多相关专利
  • [发明专利]爬虫系统-CN201511001550.6在审
  • 邹奇峰 - 乐视网信息技术(北京)股份有限公司
  • 2015-12-28 - 2016-08-17 - G06F17/30
  • 本发明实施例提供一种爬虫系统,包括:网页分析器,用于对网页进行分析,并从DNS服务器获取网页的IP地址,生成爬取任务;任务模块,用于将所述爬取任务存储到任务队列;以及爬虫模块,用于从所述任务队列中获取所述爬取任务本发明实施例的爬虫系统爬虫方法,在网页分析中执行DNS查询,避免DNS查询在爬取过程中造成管道阻塞,提高爬虫效率。
  • 爬虫系统
  • [发明专利]一种分布式爬虫调度系统-CN202011303271.6在审
  • 庞文俊;陈继;汤桂林;李小超;伊晓强 - 清创网御(合肥)科技有限公司
  • 2020-11-19 - 2021-02-26 - G06F9/48
  • 本发明公开了一种分布式爬虫调度系统,包括调度控制器、多个爬虫系统与过滤器;所述调度控制器包括调度器、分配器、内部配置有用于对爬虫任务按照调度时间进行正向排序的排序列表和用于分配爬虫任务的待采集队列;所述爬虫系统包括网页解析器与多个爬虫,每个爬虫分配了一个爬虫队列,并接受调度控制器下发的任务;所述爬虫系统的作用包括网页下载和网页解析;所述爬虫系统启动时,把本系统具备的所有爬虫爬虫位置信息上报到调度控制器。本发明计算调度时间的高效性,调度过程中的指定某类或者某个爬虫,并采用独立的过滤器支持多种模式和持续大量数据的过滤。
  • 一种分布式爬虫调度系统
  • [发明专利]一种异步爬虫系统及数据爬取方法-CN202010171572.1在审
  • 周坤朋;秦曼;王连军 - 郑州悉知信息科技股份有限公司
  • 2020-03-12 - 2020-07-10 - G06F16/951
  • 本申请提供了一种异步爬虫系统及数据爬取方法,其中,异步爬虫系统包括业务层模块和服务层模块;业务层模块在接收到来自终端的爬虫需求时,根据爬虫需求生成爬虫请求,将生成的爬虫请求进行缓存;服务层模块从已缓存的爬虫请求中取爬虫请求至Celery队列;利用Celery系统的多个任务执行单元并行爬取Celery队列中多个爬虫请求分别对应的数据,并将针对每个爬虫请求爬取的数据进行整合,以获得每个爬虫请求对应的目标数据;以及利用Celery系统将每个爬虫请求对应的目标数据返回给业务层模块,以供终端从业务层模块获取。本申请能够大大提高数据爬取效率,且当面对源源不断的爬虫需求时,能够快速地进行响应。
  • 一种异步爬虫系统数据方法
  • [发明专利]一种分布式爬虫系统及其实现方法-CN201911095920.5在审
  • 李亚萍;侯林勇;刘婉莹;王俊;张亮;杨坤;方程;袁率 - 贵州小叮当信息技术有限公司
  • 2019-11-11 - 2020-04-24 - G06F16/951
  • 本发明公开了一种分布式爬虫系统及其实现方法,包括登录窗口、日常空间和工作空间,登录窗口的输出端分别与日常空间和工作空间的输入端连接,日常空间和工作空间的输出端分别与通用网络爬虫系统和聚焦网络爬虫系统的输入端连接,本发明涉及爬虫系统技术领域。该分布式爬虫系统及其实现方法,通过设置日常空间和工作空间两种模式,并设置通用网络爬虫系统和聚焦网络爬虫系统分别搭载在两种模式上,日常空间可正常检索所有信息,而聚焦网络爬虫系统可正对性的采集与工作相关的信息,两种模式随意切换,互不干扰,且聚焦网络爬虫系统是依附于通用网络爬虫系统的主体结构使用,只需将部分程序文件替换,则可实现两种模式的切换。
  • 一种分布式爬虫系统及其实现方法
  • [发明专利]检测反爬虫策略安全性的方法及装置-CN201610537443.3有效
  • 崔广宇;李巍 - 携程计算机技术(上海)有限公司
  • 2016-07-08 - 2019-05-21 - H04L29/06
  • 本发明公开了一种检测反爬虫策略安全性的方法及装置,其中,所述方法包括:在网站的第一前端页面中嵌入用于实现反爬虫策略的反爬虫代码;利用所述反爬虫代码检测访问所述第一前端页面的用户是否为爬虫,将被检测出是爬虫的用户记为目标对象;验证所述目标对象是否为爬虫,统计所述目标对象非爬虫的次数;根据所述次数计算所述反爬虫策略的误伤率,所述误伤率用于衡量所述反爬虫策略的安全性。本发明弥补了现有技术对反爬虫策略的安全性检测不当造成系统伤害的不足,能够对反爬虫策略安全性准确检测,便于及时对反爬虫策略进行修改或更新,避免由于反爬虫策略的安全性对线上系统的稳定性造成影响,在检测爬虫的同时保证系统的稳定性
  • 检测爬虫策略安全性方法装置
  • [发明专利]一种负载均衡的分布式大数据爬虫系统-CN201710193568.3在审
  • 张宏斌;朱斌;刘威;李心恺;薛晓峰 - 江苏飞搏软件股份有限公司
  • 2017-03-28 - 2017-08-18 - H04L29/08
  • 本发明涉及一种负载均衡的分布式大数据爬虫系统,包括用户管理端、服务器端、爬虫集群端和数据存储端,用户管理端是爬虫系统对管理者提供的Web接口,管理者通过用户管理端连接并访问Web平台,服务器端通过服务接口连接用户管理端,在服务器端设有爬虫负载均衡管理模块、爬虫任务调度模块、爬虫性能监控模块,爬虫集群端设有若干个彼此独立的网络爬虫节点,所有网络爬虫节点均通过爬行器接口连接服务器端,设置在数据存储端的存储接口通过数据总线连接爬虫集群端,数据存储端设有用于存储抓取结果文件的数据库系统。该系统通过管理者对网络爬虫集群进行统一管理和分布式部署,能灵活管理爬虫任务,实现爬虫集群的负载均衡,使得爬虫工作高效、稳定。
  • 一种负载均衡分布式数据爬虫系统
  • [发明专利]一种分布式爬虫管理系统及其方法-CN201710092369.3有效
  • 刘希;陈进宝;刘光辉 - 国信优易数据有限公司
  • 2017-02-21 - 2020-08-18 - G06F16/951
  • 本发明公开一种分布式爬虫管理系统,包括:用于系统登录和数据展示的主页展示模块;创建项目和对项目进行管理的项目管理模块;对项目爬虫进行部署和管理的爬虫管理模块;对爬虫数据进行监控管理的数据管理模块;对爬虫节点进行管理的节点管理模块和对用户的爬虫进行代理管理的代理管理模块,其中,所述爬虫节点为从云平台上申请的虚拟机。此外,本发明还提供一种分布式爬虫管理方法。本发明的分布式爬虫管理系统能够提供反爬解决方案以及爬虫和数据的管理与分析,从而为企业或个人提供安全、高效的数据爬取解决方案。
  • 一种分布式爬虫管理系统及其方法
  • [发明专利]多中心综合网络爬虫系统-CN202010206809.5有效
  • 闫长江 - 新华智云科技有限公司
  • 2020-03-23 - 2023-09-01 - G06F16/951
  • 本发明公开了一种多中心综合网络爬虫系统,包括:爬虫中心和若干不同特色业务中心;若干不同特色业务中心分别处理不同的特色业务;爬虫中心用于对爬虫进行集中管理为不同特色业务中心服务;爬虫中心包括:爬虫池、爬虫执行缓存池、爬虫持久化数据库、爬虫维护API、爬虫执行器和爬虫组。本发明的有益之处在于,用户覆盖面广,爬虫的利用率及效益高。
  • 中心综合网络爬虫系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top