[发明专利]一种互联网网页采集方法在审
申请号: | 201710822007.5 | 申请日: | 2017-09-14 |
公开(公告)号: | CN110069682A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 梁威;谢宏亮 | 申请(专利权)人: | 长沙博为软件技术股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/22;G06F16/28;G06F16/31;G06F16/13 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410013 湖南省长沙市长沙高*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互联网网页 目标定位 采集 调用 自动化 半自动化 采集数据 计算分析 静态数据 流程配置 数据采集 数据分析 数据监听 移动数据 脚本库 脚本 等大 存储 后台 网页 配置 分析 | ||
1.一种互联网网页采集方法,包括网页目标定位、流程配置、开始采集,其特征在于,包括如下步骤:
a)、调用后台脚本库方法进行目标定位;
b)、配置调用自动化执行脚本方法;
c)、采集数据进行存储。
2.根据权利要求1所述的互联网网页采集方法,其特征在于:所述步骤a)中,通过调用后台封装的脚本库,完成对目标页面的定位,其包括精准定位,模糊定位,组合定位等获取精准数据的方法。
3.根据权利要求1所述的互联网网页采集方法,其特征在于:所述步骤b)中,通过调用后台封装的脚本库,根据用户自定义配置,程序可自动执行页面上的操作,程序可以通过配置,在规定时间内,或者某个时间段进行自动化操作。
4.根据权利要求1所述的互联网网页采集方法,其特征在于:所述步骤c)中,通过执行后台脚本库方法,分析出需要存储的数据进行存储。
5.根据权利要求4所述的互联网网页采集方法,其特征在于:所述步骤c)中,所述存储的存储方式可以是本地或远程数据库,也可以以文件方式存储,如Excel、JSON、TXT,XML等方式进行本地异地存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙博为软件技术股份有限公司,未经长沙博为软件技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710822007.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网页数据抓取系统
- 下一篇:一种基于浏览器爬取数据的方法及装置