[发明专利]一种数据获取方法、装置及系统在审
| 申请号: | 201910646996.6 | 申请日: | 2019-07-17 |
| 公开(公告)号: | CN110347902A | 公开(公告)日: | 2019-10-18 |
| 发明(设计)人: | 张博 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/73;G06F21/10 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘佳 |
| 地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标获取 数据获取 抓取 数据服务器 装置及系统 目标数据 数据服务器请求 数据获取过程 第一模块 返回目标 加密规则 请求获取 数据地址 网络请求 预设规则 发送方 网路 破解 服务器 工作量 发送 筛选 终端 配置 | ||
1.一种数据获取方法,其特征在于,应用于第一模块;所述方法包括:
在第二模块向数据服务器请求目标数据时,抓取所述第二模块向所述数据服务器发送的至少一个网络请求;
根据预设规则,从抓取到的网路请求中筛选出目标获取请求;所述数据服务器在接收到所述目标获取请求后返回所述目标数据的数据地址;
利用所述目标获取请求获取所述目标数据。
2.根据权利要求1所述的方法,其特征在于,所述利用所述目标获取请求获取所述目标数据,具体包括:
发送所述目标获取请求至所述数据服务器;
接收所述数据服务器对所述目标获取请求的应答;所述应答携带所述目标数据的数据地址;
从所述数据服务器对目标获取请求的应答中获取所述目标数据的数据地址;
利用所述目标数据的数据地址,获取所述目标数据。
3.根据权利要求1所述的方法,其特征在于,所述根据预设规则,从抓取到的网路请求中筛选出目标获取请求,具体包括:
判断待选网络请求中是否包括期望域名和/或期望参数;所述待选网络请求是所述抓取到的网路请求中的任意一个;
若是,则将所述待选网络请求作为所述目标获取请求。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述第二模块向数据服务器请求目标数据时,抓取所述第二模块向所述数据服务器发送的至少一个网络请求,之前还包括:
将所述目标数据的源url和用户登陆信息发送至所述第二模块,以使所述第二模块利用所述源url和所述用户登陆信息发送所述网络请求至所述数据服务器。
5.根据权利要求4所述的方法,其特征在于,所述用户登陆信息包括所述用户登陆临时文件,所述将所述目标数据的源url和用户登陆信息发送至所述第二模块,之前还包括:
判断所述用户登陆临时文件是否有效;
若否,则重新登录所述数据服务器获得有效的用户登陆临时文件。
6.根据权利要求4所述的方法,其特征在于,所述将所述目标数据的源url和用户登陆信息发送至所述第二模块,之前还包括:
判断所述用户登陆信息的使用频率是否超于预设阈值;
若是,则更新所述用户登陆信息。
7.一种数据获取装置,其特征在于,应用于第一模块;所述装置包括:请求获取单元、请求提取单元和数据获取单元;
所述请求获取单元,用于在第二模块向数据服务器请求目标数据时,抓取所述第二模块向所述数据服务器发送的至少一个网络请求;
所述请求提取单元,用于根据预设规则,从抓取到的网路请求中筛选出目标获取请求;所述数据服务器在接收到所述目标获取请求后返回所述目标数据的数据地址;
所述数据获取单元,用于利用所述目标获取请求获取所述目标数据。
8.一种数据获取系统,其特征在于,包括:第一模块和第二模块;
所述第二模块,用于发送网络请求至数据服务器;所述网络请求用于从所述数据服务器获取目标数据,所述网络请求包括目标获取请求,所述数据服务器在接收到所述目标获取请求后返回所述目标数据的数据地址;
所述第一模块,用于在所述第二模块向所述数据服务器请求所述目标数据时,抓取所述第二模块发送的网络请求,并根据预设规则从抓取到的网路请求中筛选出所述目标数据获取请求,利用所述目标获取请求获取所述目标数据。
9.根据权利要求8所述的系统,其特征在于,所述第二模块为多个;
所述第一模块,还用于基于负载均衡规则,向每个所述第二模块发送各个目标数据的源url和用户登陆信息;
所述第二模块,具体用于利用所述第一模块发送的目标数据的源url和用户登陆信息,发送网络请求至所述数据服务器。
10.根据权利要求8或9所述的系统,其特征在于,
所述第一模块,还用于按照预设周期,重启所述第二模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910646996.6/1.html,转载请声明来源钻瓜专利网。





