专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果592592个,建议您升级VIP下载更多相关专利
  • [发明专利]一种爬虫部署方法、系统、装置、设备及存储介质-CN202011509553.1在审
  • 刘海飞;刘国宏;姜卓;魏峻 - 山东中创软件工程股份有限公司
  • 2020-12-18 - 2021-04-06 - G06F16/951
  • 本申请公开了一种爬虫部署方法、系统、装置、设备及存储介质,包括:利用本地的目录监测工具对本地的爬虫目录进行监测,以确定爬虫目录中由开发平台向爬虫目录发布爬虫项目引起的增量文件;利用本地的增量同步工具将所述增量文件同步至从服务器,以更新从服务器的爬虫目录;基于预设任务分配规则,将爬虫项目对应的爬虫任务分配至从服务器,以便从服务器基于从服务器的爬虫目录执行主服务器分配的爬虫任务。本申请通过在主服务器和从服务器搭建目录监测和增量同步架构以实现由开发平台向服务器集群中的爬虫目录发布的爬虫项目的实时增量同步,提高了服务器集群间的爬虫项目的增量同步效率及精确度。
  • 一种爬虫部署方法系统装置设备存储介质
  • [发明专利]一种网络爬虫率的自动化测试方法及装置-CN201510957702.3有效
  • 徐香联 - 北京锐安科技有限公司
  • 2015-12-17 - 2018-12-25 - G06F11/36
  • 本发明实施例公开了一种网络爬虫率的自动化测试方法及装置。该方法包括:访问从爬虫程序的爬虫种子库中读取的种子网址关联的网页,并从所述网页的链接属性中获得设定数值个候选链接;对所述候选链接进行筛选,以得到目标链接,并将所述目标链接导入到测试工具中;依据所述测试工具中导入的目标链接和所述爬虫程序的爬虫结果数据,确定所述爬虫程序的爬全率。本发明实施例中的技术方案,相比于现有技术手动验证爬虫程序的性能,提高了对爬虫程序的测试效率。
  • 一种网络爬虫自动化测试方法装置
  • [发明专利]一种解决Web证书认证的爬虫方法-CN201711405633.0在审
  • 王晓斌;傅玉生;勇萌哲;田坤鹏 - 成都优易数据有限公司
  • 2017-12-22 - 2018-04-20 - G06F17/30
  • 本发明公开了一种解决Web证书认证的爬虫方法,涉及有证书的Web爬虫方法领域;其包括步骤1获取目标网站的Web证书后根据证书的类型选择不同的方式导入证书获取Scrapy爬虫框架访问URL的权限;步骤2在Scrapy爬虫框架的下载中间件DownLoad Middleware中集成自动化工具Selenium实现Scrapy爬虫框架访问URL暨模拟为浏览器访问;步骤3基于步骤2进入浏览器后重写Scrapy爬虫框架中的下载中间件Downloader Middleware,并使用自动化工具Selenium的Webdriver获取Web页内容,将其返回给Scrapy爬虫框架中的爬虫Spider并进行解析获取数据完成爬虫工作。本发明解决了现有Scrapy爬虫框架无法完成对有证书验证的网站的爬虫工作的问题,达到了高效实现对有证书验证的网站的爬虫工作的效果。
  • 一种解决web证书认证爬虫方法
  • [发明专利]自定义数据采集系统及方法-CN201911197455.6在审
  • 田丹;田俊豪;银虹宇;李奇宇 - 电子科技大学;成都精准云教育科技有限公司
  • 2019-11-29 - 2020-04-03 - G06F8/20
  • 本申请涉及一种自定义数据采集系统及方法,所述系统包括:任务生成模块和数据采集模块;任务生成模块用于为用户提供可视化交互界面,以便用户通过可视化交互界面自定义爬虫任务脚本;数据采集模块用于采用Web应用程序的自动化测试工具Selenium、基于所述爬虫任务脚本进行数据采集,以及进行数据存储。如此设置,用户可以通过可视化交互界面自定义爬虫任务脚本,轻松地实现对爬虫任务的创建,并通过selenium工具实现对数据的采集。并且selenium的工作原理不同于传统的测试工具,因此可以绕过传统爬虫遇到的反爬虫机制方面的问题,从而具有很高的通用性。
  • 自定义数据采集系统方法
  • [发明专利]一种页面渲染方法及装置-CN201811612452.X有效
  • 许宏斌 - 广州华多网络科技有限公司
  • 2018-12-27 - 2020-11-20 - G06F9/451
  • 本发明提供了一种页面渲染方法及装置,该方法包括:通过反向代理工具判断获取到的页面访问请求是否为爬虫,若是,则执行下一步;通过Nodejs服务向反向代理工具发送页面加载中指令,根据预置脚本对原始页面进行渲染,得到同构页面;通过Nodejs服务向反向代理工具发送页面加载完成指令和同构页面,以完成爬虫操作和页面显示。本发明在执行爬虫前对原始页面进行提前渲染,使得爬虫能够抓取已经渲染的同构页面,解决传统前端渲染所存在的SEO问题。
  • 一种页面渲染方法装置
  • [发明专利]一种爬虫采集内容结构化的方法-CN201410111764.8有效
  • 程瑶 - 浪潮电子信息产业股份有限公司
  • 2014-03-25 - 2018-02-23 - G06F17/30
  • 本发明公开了一种爬虫采集内容结构化的方法,适用于爬虫对网页的解析阶段,其适用的体系结构包括爬虫模块、解析模块和结合模块;其中,爬虫模块实现整个数据采集过程,包含结合模块;解析模块是实现网页解析的独立模块;结合模块用于连接爬虫模块和解析模块。该方法利用结合模块把爬虫模块和专业的网页解析模块结合到了一起,在爬虫进行到解析阶段时,会自动调用解析模块的内容;解析完毕后,会继续爬虫模块的剩余流程,将已经结构化完毕的字段提交给搜索引擎。该方法通过把具有网页解析功能的工具爬虫结合,实现对用户需要字段的自定义解析、自定义提取,使用灵活,可以有效扩展可结构化的字段,扩大后期搜索分析的范围。
  • 一种爬虫采集内容结构方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top