专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果920854个,建议您升级VIP下载更多相关专利
  • [发明专利]一种增量更新与技术-CN201310040088.5在审
  • 尹科 - 北京英富森信息技术有限公司
  • 2013-02-01 - 2014-08-06 - G06F17/30
  • 本发明涉及一种增量更新与技术,包括:判断待网页内容的UR是否为静态页面的链接地址;当待网页内容的URL为静态页面的链接地址时,判断所述URL是否过,是则用所述URL替换已存储的URL;否则,根据日期创建年/月/日/URL链接地址的文件夹,将待网页的内容存储到所述文件夹中。本发明通过每次获取待网页的URL时,判断所述URL是属于静态页面的还是动态页面的链接地址。如果是静态页面的,则判断所述URL是否已经过,如已经过则不进行,直接将已经过的URL替换成现有的链接地址存储,实现了静态页面的增量更新存储的要求,从而减少爬虫系统更新页面的工作量,提升了页面的新鲜度
  • 一种增量更新技术
  • [发明专利]网站数据方法、装置、计算机设备及可读存储介质-CN201710620026.X有效
  • 李江华;李武奇 - 深圳壹账通智能科技有限公司
  • 2017-07-26 - 2020-08-28 - G06F16/955
  • 本发明涉及一种网站数据方法、装置、计算机设备及可读存储介质,该方法包括获取待网站数据的数据标识和产生日期;获取本地存储的与数据标识对应的网站数据的产生日期;当待网站数据的产生日期与本地存储的网站数据的产生日期不同时,则并输出产生日期在本地存储的网站数据的产生日期之前的待网站数据;当所的待网站数据的格式与本地存储的网站数据的格式相同时,则输出本地存储的产生日期与所述待网站数据的产生日期相同的网站数据上述的网站数据方法、装置、计算机设备及可读存储介质,可以直接输出本地存储的网站数据,减少的数据量,从而可以提高数据的输出显示速度。
  • 网站数据方法装置计算机设备可读存储介质
  • [发明专利]网页链接的方法及装置-CN201510463687.7有效
  • 孙德彬;冯鸳鹤 - 北京国双科技有限公司
  • 2015-07-31 - 2019-12-10 - G06F16/951
  • 本发明公开了一种网页链接的方法及装置。该网页链接的方法包括:获取失败的网页链接;基于超时时间参数集合对网页链接重新进行,得到结果,其中,超时时间参数集合中包括至少两个不同的超时时间参数;根据结果判断网页链接是否为无效的网页链接;以及如果判断出网页链接为无效的网页链接,则不再对网页链接进行。通过本发明,解决了相关技术中对无效的网页链接进行会造成爬虫资源的浪费的问题。
  • 网页链接方法装置
  • [发明专利]网页请求处理方法和装置-CN201510728872.4有效
  • 何熠皓 - 北京国双科技有限公司
  • 2015-10-30 - 2020-02-28 - G06F16/951
  • 本申请公开了一种网页请求处理方法和装置。其中,该方法包括:获取新解析得到的待请求,其中,待请求包括待页面的链接;判断是否存在存储文件,其中,存储文件用于存储待请求;在判断出不存在存储文件时,将新解析得到的待请求存储于请求队列中;以及在判断出存在存储文件时,将新解析得到的待请求存储于存储文件中。本申请解决了直接将大量的网页请求存储于内存中耗费内存空间的技术问题。
  • 网页请求处理方法装置
  • [发明专利]执行任务的方法和装置-CN201410779535.3在审
  • 何恺铎 - 北京国双科技有限公司
  • 2014-12-15 - 2015-04-01 - G06F17/30
  • 本发明公开了一种执行任务的方法和装置。其中,该方法包括:第一终端将接收到的请求发送至云服务器的云端分布式队列;第二终端从云端分布式队列中读取请求,其中,第二终端为云终端;第二终端按照请求进行网络资源的,并将结果数据保存至数据库;第一终端从数据库读取结果数据。采用本发明,解决了现有技术中使用单机执行任务效率低且IP地址容易被屏蔽的问题,达到了在避免被服务器屏蔽的情况下提高执行请求效率的效果。
  • 执行任务方法装置
  • [发明专利]数据方法及装置-CN201610096587.X在审
  • 李可欣 - 北京国双科技有限公司
  • 2016-02-22 - 2017-08-29 - G06F17/30
  • 本发明公开了一种数据方法及装置,涉及数据处理技术领域,解决了现有的数据方法数据重复率较高的问题。本发明的主要技术方案为接收爬虫程序发送的页面请求信息,所述页面请求信息中包括列表页链接;判断缓存队列中是否存在所述列表页链接,所述缓存队列中存储有爬虫程序已经过的列表页链接;若所述缓存队列中不存在所述列表页链接,则向所述爬虫程序发送所述页面请求的确认信息,以使得所述爬虫程序对所述列表页链接对应的页面进行。本发明主要用于网页数据。
  • 数据方法装置
  • [发明专利]爬虫任务完成的判断方法和装置-CN201510624770.8有效
  • 崔志伸 - 北京国双科技有限公司
  • 2015-09-25 - 2020-02-07 - G06F16/951
  • 其中,该方法包括:在当前子任务结束时,累计执行过的所有子任务得到的链接的数量,得到累计链接数;累计执行所有子任务时失败的链接数量、成功的链接数量和无效链接的数量;当失败的链接数量、成功的链接数量和无效链接的数量的总和与链接总数相同时,确定爬虫任务结束,其中,链接总数为累计链接数加1得到。本申请解决了无法准确确定任务的结束时间的技术问题。
  • 爬虫任务完成判断方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top