专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果62837个,建议您升级VIP下载更多相关专利
  • [发明专利]多平台爬虫调度方法、装置和存储介质-CN201911236647.3在审
  • 陈伟杰;高继勇 - 北京创鑫旅程网络技术有限公司
  • 2019-12-05 - 2020-04-17 - G06F16/951
  • 本发明实例提供一种多平台爬虫调度方法、装置和存储介质。本发明的方法包括:获取待爬虫任务的配置信息,待爬虫任务的配置信息包括多个数据来源平台的标识、N个数据抓取平台的类型标识、与每个数据来源平台对应的抓取开始时间以及待爬虫任务对应的多个爬虫子任务的相关信息,爬虫子任务的相关信息包括:数据来源平台与数据抓取平台的对应关系以及多条待抓取数据的属性信息,N为大于或等于1的整数;根据待爬虫任务的配置信息和预设的数据抓取分发算法,获得每个爬虫子任务的数据抓取调度信息
  • 平台爬虫调度方法装置存储介质
  • [发明专利]一种网络爬虫方法及装置-CN201510609537.2有效
  • 罗杰;梁家盟 - 北京云知声信息技术有限公司
  • 2015-09-22 - 2019-08-16 - G06F16/951
  • 本发明公开了一种网络爬虫方法及装置,用于解除网络爬虫任务中相邻执行阶段之间的耦合性,从而实现网络爬虫的每个执行阶段的模块化。所述方法包括:获取网络爬虫任务的配置文件,配置文件包括网络爬虫任务的每一个执行阶段的标识、每一个执行阶段的执行顺序及每一个执行阶段对应的配置参数;根据每一个执行阶段的标识以及每一个执行阶段的执行顺序,确定网络爬虫的当前执行阶段该技术方案解除了网络爬虫任务中相邻执行阶段之间的耦合性,使每个执行阶段的执行更加模块化,提高了网络爬虫的效率。
  • 一种网络爬虫方法装置
  • [发明专利]一种基于行为平衡度的垂直类网络爬虫检测识别方法-CN202011306830.9有效
  • 刘兰;刘浪洲;何康健 - 广东技术师范大学
  • 2020-11-19 - 2022-08-30 - H04L9/40
  • 一种基于行为平衡度的垂直类网络爬虫检测识别方法,属于计算机软件的技术领域。垂直类网络爬虫是一种针对网站数据进行定点定向爬取的网络程序,相比于传统的网络爬虫,这种爬虫的行为模式更加隐秘,对网站服务器资源占用较低,但是其行为会严重危害到网站的信息安全,造成极大的数字资产损失。现有的网络爬虫检测方式对高频恶意爬虫流量检测效果明显,对垂直类爬虫检测效果不佳,识别准确率较低。因此,本发明提出一种基于行为平衡度的垂直类网络爬虫检测识别方法,具体包括:(1)基于网站页面信息量的合理停滞时间建模;(2)基于不同跃迁深度访问的行为平衡度建模。
  • 一种基于行为平衡垂直网络爬虫检测识别方法
  • [发明专利]一种爬虫任务的监控方法和装置-CN202111105253.1在审
  • 杨峰;张令忠 - 上海妙一生物科技有限公司
  • 2021-09-22 - 2021-12-24 - G06F11/30
  • 本发明涉及一种爬虫任务的监控方法和装置,其中,该方法包括:在爬虫任务运行结束后执行以下监控操作中的至少之一:监控爬虫代码运行报错情况;监控持久化的爬取数据的更新情况;监控服务器的CPU使用率和内存占用率;根据所述监控操作的监控结果对所述爬虫任务进行监控。通过本申请,解决了相关技术中爬虫管理平台仅对爬虫运行进行监控不能有效避免数据爬取失败的问题,实现了通过对爬虫运行监控、数据监控、服务器监控尽最大可能避免了数据爬取的失败。
  • 一种爬虫任务监控方法装置
  • [发明专利]一种爬虫系统及其方法-CN201410259561.3有效
  • 于权 - 江苏敏行信息技术有限公司
  • 2014-06-12 - 2017-04-19 - G06F17/30
  • 一种爬虫系统及其方法,包括带有用于动态网页的爬虫系统的爬虫节点,爬虫节点同互联网相连接,所述的互联网中包含有网站服务器,所述的网站服务器中包含有带有频道的网站,所述的爬虫节点中还包括有浏览器、用于采集结果的数据库和频道库这样的结构结合其方法避免了现有技术中无法通过访问时间的值来控制爬虫是否继续爬取网页内容这样就极大地限制了爬虫的使用效率的缺陷。
  • 一种爬虫系统及其方法
  • [发明专利]网络爬虫识别方法和装置-CN201510250481.6有效
  • 周高明 - 阿里巴巴集团控股有限公司
  • 2015-05-15 - 2019-11-05 - G06F16/951
  • 本申请提出一种网络爬虫识别方法和装置,该网络爬虫识别方法包括:接收客户端在网页渲染完毕后发送的所述网页的图片和所述网页的URL;根据所述URL获取样本图片;根据相似度与预设阈值的比较,识别所述客户端是否为网络爬虫本申请对网络爬虫识别的可靠性较高,不影响正常用户浏览网页的流畅性,并且即便网络爬虫破解了上述识别方法,也会极大的消耗网络爬虫自身的资源,降低网络爬虫访问网页的频率。
  • 网络爬虫识别方法装置
  • [发明专利]网络爬虫识别方法和装置-CN201910957170.1有效
  • 周高明 - 阿里巴巴集团控股有限公司
  • 2015-05-15 - 2023-06-30 - G06F16/951
  • 本申请提出一种网络爬虫识别方法和装置,该网络爬虫识别方法包括:接收客户端在网页渲染完毕后发送的所述网页的图片和所述网页的URL;根据所述URL获取样本图片;根据相似度与预设阈值的比较,识别所述客户端是否为网络爬虫本申请对网络爬虫识别的可靠性较高,不影响正常用户浏览网页的流畅性,并且即便网络爬虫破解了上述识别方法,也会极大的消耗网络爬虫自身的资源,降低网络爬虫访问网页的频率。
  • 网络爬虫识别方法装置
  • [发明专利]一种可视化爬虫代码编写与调试方法-CN202010884239.5在审
  • 陈开冉;黎展;马帅 - 广州探迹科技有限公司
  • 2020-08-28 - 2020-12-18 - G06F11/36
  • 为了解决编程技术薄弱的用户难以使用现有网络爬虫软件的问题,本公开提供了一种可视化爬虫代码编写与调试方法及系统,便于编程技术薄弱的用户使用。包括:接收用户输入的模式选择指令;根据模式选择指令进入第一模式或第二模式;进入第一模式后,获取用户输入的第一指令;基于第一指令爬取所需的第一目标数据;进入第二模式后,生成用于供用户输入爬虫脚本代码的代码编码区,并获取用户输入的第二指令;基于第二指令,将代码编码区中的爬虫脚本代码提交到外部的爬虫调度系统,获取爬虫调度系统根据爬虫脚本代码执行爬虫任务时所爬取的第二目标数据。本申请还公开了相应的系统,本公开的系统和方法便于编程技术薄弱用户使用网络爬虫爬取所需数据。
  • 一种可视化爬虫代码编写调试方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top