专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果62837个,建议您升级VIP下载更多相关专利
  • [发明专利]网络爬虫识别方法-CN201310200211.5有效
  • 张旭东 - 百度在线网络技术(北京)有限公司
  • 2013-05-27 - 2013-09-04 - G06F17/30
  • 提供一种网络爬虫识别方法。所述网络爬虫识别方法,包括以下步骤:确定入口网页上能够导向后端页面的连接;在每个确定的连接中创建新的无效连接;将创建的无效连接设置为隐蔽形式;当发出对隐蔽形式的无效连接的请求时,将所述请求识别为网络爬虫请求所述网络爬虫识别方法可以准确地判断请求是否是网络爬虫发出,并且随着使用时间增加,识别效果会随着使用时间的积累而显著改善。
  • 网络爬虫识别方法
  • [发明专利]申请登录凭证的方法和装置-CN201510706429.7有效
  • 崔志伸 - 北京国双科技有限公司
  • 2015-10-27 - 2020-05-12 - G06F21/33
  • 本发明公开了一种申请登录凭证的方法和装置,涉及互联网技术领域,能够解决现有技术中爬虫程序申请登录凭证效率低的问题。本发明的方法主要包括:接收爬虫程序发送的登录凭证请求,所述登录凭证请求用于申请获得所述爬虫程序待爬取网站的登录凭证;获取所述登录凭证请求中携带的网址;从本地获取与所述网址对应的登录凭证;向所述爬虫程序发送所述登录凭证本发明主要适用于爬虫程序爬取网页的场景中。
  • 申请登录凭证方法装置
  • [发明专利]一种测试网络爬虫的方法及系统-CN201410655647.8有效
  • 王辉 - 阿里巴巴集团控股有限公司
  • 2014-11-18 - 2019-03-26 - H04L12/26
  • 本申请实施例公开了一种测试网络爬虫的方法及系统,所述方法包括:第一服务器配置预设数量的顶级域名,并将所述顶级域名设置为指向第二服务器的IP地址;网络爬虫服务器读取所述顶级域名并根据所述顶级域名扩展出海量域名;网络爬虫服务器遍历所述海量域名,并针对每个域名向第二服务器发起抓取请求;第二服务器选取网站,并将所述网站提供给网络爬虫服务器抓取。本申请实施例公开的测试网络爬虫的方法及系统,可以在不对真实网站形成打扰的情况下,检测网络爬虫抓取海量网站页面时的工作性能。
  • 一种测试网络爬虫方法系统
  • [发明专利]一种基于深度学习的反爬虫方法、装置和介质-CN202010217160.7在审
  • 张洲梁;宗云兵 - 山东浪潮通软信息科技有限公司
  • 2020-03-25 - 2020-07-17 - G06F16/951
  • 本发明提供一种基于深度学习的反爬虫方法、装置和介质,该方法包括以下步骤:使用爬虫工具对网站进行爬取,并记录普通用户对所述网站的正常访问行为,将所述爬取行为的信息和所述正常访问行为的信息存储在数据库中;根据所述数据库中的信息对爬虫判别模块中的分类器基本模型进行训练;响应于接收到web请求及其IP,将所述请求信息和所述IP的访问历史记录输入到所述训练好的模型中以判断是否为爬虫;响应于判断所述web请求为爬虫,对所述web请求进行拦截并封禁所述IP,并将所述IP写入黑名单中本发明基于深度学习算法,可以准确识别基于多种爬虫框架的爬虫程序,成功改进了网站反爬机制,识别率高、误杀率低。
  • 一种基于深度学习爬虫方法装置介质
  • [发明专利]网页数据爬取方法及系统-CN201911167305.0在审
  • 方兴;刘伟光;杨凯华 - 爱信诺征信有限公司
  • 2019-11-25 - 2020-04-10 - G06F16/951
  • 该方法包括:根据前端发布的爬虫任务,调用部署于服务端本地的爬虫服务发布下载报文,以由客户端根据所述下载报文得到响应结果;根据所述客户端反馈的所述响应结果,通过所述爬虫服务对所述响应结果进行解析,得到所述网页数据该方法中,客户端负责根据下载报文向目标站点发起网页请求,获取响应结果,并将响应结果反馈给服务端,由服务端负责执行爬虫脚本,根据响应结果爬取网页数据,不需要将爬虫脚本转换为客户端运行环境下特定软件开发工具包的脚本,也不需要在客户端部署爬虫运行的环境,由此因而降低了爬虫服务对客户端执行环境的依赖。
  • 网页数据方法系统
  • [发明专利]爬虫处理方法、装置、服务器及计算机可读存储介质-CN201910965767.0在审
  • 杜晓宇 - 平安科技(深圳)有限公司
  • 2019-10-12 - 2020-02-28 - G06F16/951
  • 本申请实施例提供了一种爬虫处理方法、装置、服务器及计算机可读存储介质,该方法包括:接收终端发送的对指定抓取任务的任务启动指令,该任务启动指令包括该指定抓取任务的第一配置记录、第二配置记录、第三配置记录;根据第一配置记录包括的种子信息和该第二配置记录包括的针对该指示至少一类待抓取页面中每类待抓取页面的爬虫配置信息执行爬虫操作,得到该每类待抓取页面对应的爬虫数据集合;根据第三配置记录包括的每类待抓取页面对应的解析规则,从该每类待抓取页面对应的爬虫数据集合包括的各页面中解析出目标数据。采用本申请,可以使得爬虫过程更具针对性,并可以提高可扩展性,提升爬虫效率。
  • 爬虫处理方法装置服务器计算机可读存储介质
  • [发明专利]一种多源科创资源数据采集方法-CN202111505650.8在审
  • 刘啸;杨昀 - 江苏宝和数据股份有限公司
  • 2021-12-10 - 2022-01-11 - G06F16/951
  • 本发明公开了一种多源科创资源数据采集方法,包括爬虫模块、路由模块和动态页面解析模块;爬虫模块是指一个爬虫模块的集群中,会包含多个爬虫模块,爬虫模块主要的两个功能是页面下载和页面信息提取;路由模块的主要功能是对整个分布式网页爬虫系统进行任务的接受、管理、分发,任务的负载均衡,爬虫服务和动态页面解析服务节点的管理以及系统内心跳包的发送;动态页面解析模块是指以集群的模式针对动态页面进行页面解析,针对多源异构的科创数据,提出了一种多源科创数据的采集方法
  • 一种多源科创资源数据采集方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top