[发明专利]代理服务器及互联网数据的采集方法在审
| 申请号: | 201711396097.2 | 申请日: | 2017-12-21 |
| 公开(公告)号: | CN108108440A | 公开(公告)日: | 2018-06-01 |
| 发明(设计)人: | 龚权 | 申请(专利权)人: | 北京慧数科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京兆君联合知识产权代理事务所(普通合伙) 11333 | 代理人: | 刘俊玲 |
| 地址: | 100193 北京市海淀区东*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 采集 代理服务器 互联网数据 采集软件 模拟浏览器 站点 数据流 脚本 登录 渲染 数据采集效率 接收客户端 目标服务器 采集数据 人力物力 数据采集 网站内容 客户端 数据包 数据发 源程序 网站 解析 回复 发送 | ||
1.一种互联网数据的采集方法,其特征在于,包括:
接收客户端发送的向目标服务器的待采集站点采集数据的采集请求;
解析所述采集请求并得到待采集站点的URL地址;
模拟浏览器登录所述URL地址并执行Javascript脚本渲染以得到所述待采集站点的数据流;
将所述数据流作为回复数据包发送给所述客户端。
2.根据权利要求1所述的方法,其特征在于,所述浏览器配置为采用能够执行Javascript脚本渲染并得到站点内容的浏览器。
3.一种代理服务器,其特征在于,包括:
数据接收模块,其用于接收客户端发送的向目标服务器的待采集站点采集数据的采集请求;
解析模块,其用于解析所述采集请求并得到待采集站点的URL地址;
模拟模块,其用于模拟浏览器登录所述URL地址并执行Javascript脚本渲染以得到所述待采集站点的数据流;
数据发送模块,其用于将所述数据流作为回复数据包发送给所述客户端。
4.根据权利要求3所述的代理服务器,其特征在于,所述浏览器配置为采用能够执行Javascript脚本渲染并得到站点内容的浏览器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京慧数科技有限公司,未经北京慧数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711396097.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:行为数据的识别方法及装置
- 下一篇:一种数据库表结构分析方法和系统





