[发明专利]云计算系统在审
申请号: | 201810207498.7 | 申请日: | 2018-03-14 |
公开(公告)号: | CN110309389A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 陈桦 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F16/18 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种云计算系统,包括:应用程序界面接口,用于提供用户接口,以获取用户提交的抓取任务;种子库,连接至应用程序界面接口,用于预存抓取任务对应的资源定位符;任务生成器,连接至种子库,用于获取资源定位符,并将资源定位符投递至对应的爬虫模块;爬虫模块,连接至任务生成器,用于根据资源定位符抓取对应的网站数据和/或网页数据。通过本发明的技术方案,支持全网抓取数据,提高了抓取有效数据的可靠性。 | ||
搜索关键词: | 抓取 资源定位符 应用程序界面 任务生成器 云计算系统 爬虫模块 种子库 网页数据 网站数据 用户接口 用户提交 有效数据 全网 预存 投递 | ||
【主权项】:
1.一种云计算系统,其特征在于,包括:应用程序界面接口,用于提供用户接口,以获取用户提交的抓取任务;种子库,连接至所述应用程序界面接口,用于预存所述抓取任务对应的资源定位符;任务生成器,连接至所述种子库,用于获取所述资源定位符,并将所述资源定位符投递至对应的爬虫模块;所述爬虫模块,连接至所述任务生成器,用于根据所述资源定位符抓取对应的网站数据和/或网页数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810207498.7/,转载请声明来源钻瓜专利网。