专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果62837个,建议您升级VIP下载更多相关专利
  • [发明专利]爬虫程序的调度方法、调度装置、服务器和存储介质-CN202310517799.0在审
  • 陈琪钛;黄有才 - 广州钛动科技股份有限公司
  • 2023-05-09 - 2023-08-29 - H04L9/40
  • 本申请涉及一种爬虫程序的调度方法、调度装置、服务器和存储介质。所述方法包括:获取代理节点的性能指标数据;其中,代理节点为用于执行待调度爬虫程序的网络节点,性能指标数据表征代理节点在当前运行状态下执行爬虫程序时的性能裕度;基于性能指标数据,确定代理节点分别执行多个待调度爬虫程序的性能损耗数据;其中,性能损耗数据表征代理节点在当前运行状态下执行爬虫程序时关于性能裕度的损耗程度;基于性能指标数据和性能损耗数据,在多个待调度爬虫程序中确定目标爬虫程序,并将目标爬虫程序调度至代理节点。采用本方法能够增强对爬虫程序进行分配调度的合理性和有效性,提升执行爬虫程序时的执行效率和执行质量。
  • 爬虫程序调度方法装置服务器存储介质
  • [发明专利]一种房屋信息采集服务系统-CN201410545328.1有效
  • 贾岩 - 深圳市易图资讯股份有限公司
  • 2014-10-15 - 2019-03-22 - G06F16/951
  • 本发明公开了一种房屋信息采集服务系统,包括:网站爬虫组件,用于针对一个网站的抓取工作,针对网站的页面元素与特点进行专门的解析,完成数据抽取后,映射到对应的数据实体当中,再交给网站爬虫服务模块进行数据的保存;监控服务模块,用于监控网站爬虫服务模块的工作情况,及各个网站爬虫组件的工作情况,及时发现网站爬虫组件是否工作正常,抓取的数据是否正确;管理服务模块,用于整个网站爬虫服务的管理与配置;部署服务模块,用于升级了网站爬虫组件后部署升级网站爬虫组件;调度服务模块,用于调度网站爬虫服务里面的网站爬虫组件如何工作、什么时候工作、什么时候停止。
  • 一种房屋信息采集服务系统
  • [发明专利]一种爬虫检测方法、web应用云防火墙、装置和存储介质-CN202110968443.X有效
  • 娄宇;范渊;杨勃 - 杭州安恒信息技术股份有限公司
  • 2021-08-23 - 2023-02-24 - H04L9/40
  • 本申请涉及一种爬虫检测方法、web应用云防火墙、装置和存储介质,通过获取站点的爬虫数据,其中,爬虫数据携带有来源IP地址、用户代理信息和时间戳;将来源IP地址和预设IP地址进行匹配,根据相匹配的预设IP地址携带的标签初步确定来源IP地址的恶意倾向,其中,标签所指示的恶意倾向从高到低排列分别包括第一等级、第二等级和第三等级;在来源IP地址的恶意倾向属于第二等级的情况下,根据爬虫数据生成各用户代理的爬虫特征信息,并将爬虫特征信息和爬虫行为规则进行匹配,根据相匹配的爬虫行为规则最终确定用户代理的恶意倾向,解决了相关技术中爬虫检测方法存在检测不够准确的问题,提升了爬虫检测方法的准确度。
  • 一种爬虫检测方法web应用防火墙装置存储介质
  • [发明专利]一种网络爬虫率的自动化测试方法及装置-CN201510957702.3有效
  • 徐香联 - 北京锐安科技有限公司
  • 2015-12-17 - 2018-12-25 - G06F11/36
  • 本发明实施例公开了一种网络爬虫率的自动化测试方法及装置。该方法包括:访问从爬虫程序的爬虫种子库中读取的种子网址关联的网页,并从所述网页的链接属性中获得设定数值个候选链接;对所述候选链接进行筛选,以得到目标链接,并将所述目标链接导入到测试工具中;依据所述测试工具中导入的目标链接和所述爬虫程序的爬虫结果数据,确定所述爬虫程序的爬全率。本发明实施例中的技术方案,相比于现有技术手动验证爬虫程序的性能,提高了对爬虫程序的测试效率。
  • 一种网络爬虫自动化测试方法装置
  • [发明专利]爬取网页的方法及装置-CN201610070457.9在审
  • 李新国;樊思国;贺达 - 北京国双科技有限公司
  • 2016-02-01 - 2017-08-08 - G06F17/30
  • 本发明的方法包括获取爬虫种子,所述爬虫种子为网络爬虫要爬取的网页的统一资源定位符URL;根据每个爬虫种子的优先级将所述爬虫种子注入到与其优先级对应的队列中,不同优先级对应不同队列;将对应不同优先级的队列发送给所述网络爬虫,以使得所述网络爬虫根据预设提取规则从不同队列中提取所述爬虫种子,并按照提取的爬虫种子进行网页爬取。
  • 网页方法装置
  • [发明专利]断点恢复方法及装置-CN201910932764.7在审
  • 满悦 - 北京国双科技有限公司
  • 2019-09-29 - 2021-03-30 - G06F16/951
  • 本发明公开了一种断点恢复方法及装置,在爬虫爬取页面出错后,会获取爬虫爬取过程中的爬虫爬取记录,然后从所述爬虫爬取记录中,筛选出末次爬取记录,末次爬取记录包括爬虫爬取出错时的爬虫爬取操作,然后基于所述末次爬取记录,进行断点恢复操作,就可以恢复了爬虫在爬取出错时的爬取操作,此后可以继续执行后续的爬取操作,本发明直接断点恢复到爬取出错时的爬取操作,实现了高效断点恢复。
  • 断点恢复方法装置
  • [发明专利]爬取任务的分配方法及装置-CN201811291178.0在审
  • 李强 - 北京国双科技有限公司
  • 2018-10-31 - 2020-05-08 - G06Q10/06
  • 本发明公开了一种爬取任务的分配方法及装置,涉及爬虫技术领域,提高了爬虫服务器对爬取任务进行分配调度的效率。本发明的方法包括:接收爬虫设备发送的任务分配请求,其中,所述任务分配请求中包含所述爬虫设备对应的设备标识,所述设备标识用于唯一标识所述爬虫设备;根据所述设备标识,确定所述爬虫设备对应的爬取能力;获取与所述爬取能力相匹配的待处理爬取任务,并将所述待处理爬取任务发送至所述爬虫设备。本发明适用于爬虫服务器对爬取任务进行分配调度的过程中。
  • 任务分配方法装置
  • [发明专利]分布式爬虫实现方法和装置-CN202011573515.2在审
  • 任亮;傅雨梅;徐林;文齐辉 - 北京知因智慧科技有限公司
  • 2020-12-25 - 2021-04-02 - G06F16/951
  • 本发明提供了一种分布式爬虫实现方法和装置,涉及爬虫应用技术领域,包括创建爬虫任务,并根据爬虫任务中的采集任务和解析任务分别确定对应分布的部署节点,其中,爬虫任务包括至少一个;启动爬虫任务,基于预先确定的警告规则和质量检测规则分别对采集任务和解析任务进行监控;若监控状态异常,则发出警告,并重新对爬虫任务进行分布部署;若监控状态正常,则持续运行爬虫任务,并将爬取数据写入数据库,通过分布式节点部署,在提高多个爬取任务速度的同时,还对爬取任务的状态进行监控,同时保证数量和质量
  • 分布式爬虫实现方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top