[实用新型]网页数据采集装置有效
申请号: | 201620765180.7 | 申请日: | 2016-07-20 |
公开(公告)号: | CN206021264U | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | 潘万康;邓昌银 | 申请(专利权)人: | 贵州亿垒科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙)50217 | 代理人: | 蒙捷 |
地址: | 563000 贵州省*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本专利公开了互联网数据处理领域中的一种网页数据采集装置,包括壳体,壳体内设有电子芯片,电子芯片包括端口模块、抽取模块、虚拟模块和存储模块;端口模块包括连接单元,输入单元和输出单元;虚拟模块包括虚拟发生子模块和虚拟空间子模块;虚拟空间子模块包括第一确定单元、第二确定单元、删减单元和确定采集单元;存储模块包括存储单元和压缩单元;连接单元与输入单元间、输入单元与抽取模块间、存储单元与压缩单元间、存储单元与输出单元间、第二确定单元与删减单元间、抽取模块与第一确定单元间、第一确定单元与第二确定单元间、第二确定单元与存储单元间、存储单元与第一确定单元间均采用电信号连接。通过优化设计,提高了数据的采集速度。 | ||
搜索关键词: | 网页 数据 采集 装置 | ||
【主权项】:
网页数据采集装置,其特征在于:包括壳体,壳体内设有电子芯片,电子芯片包括端口模块、抽取模块、虚拟模块和存储模块;端口模块包括连接单元、输入单元和输出单元;虚拟模块包括虚拟发生子模块和虚拟空间子模块;虚拟空间子模块包括第一确定单元、第二确定单元、删减单元和确定采集单元;存储模块包括存储单元和压缩单元;连接单元与输入单元间通过电信号双向连接,输入单元与抽取模块间通过电信号双向连接,抽取模块通过电信号单向连接第一确定单元,第一确定单元通过电信号单向连接第二确定单元,第二确定单元与删减单元间通过电信号双向连接,第二确定单元通过电信号单向连接存储单元,存储单元与压缩单元间通过电信号双向连接,存储单元通过电信号双向连接输出单元和单向连接第一确定单元;抽取模块,用于根据采集到的列表页对应网页的内容,抽取每个内容所在的内容页的统一资源定位符信息;连接单元,用于与计算机进行连接;输入单元,用于将网页传输到抽取模块;输出单元,用于将标识信息传输至网络;虚拟发生子模块,用于产生大容量虚拟空间;第一确定单元,用于根据抽取的每个内容页的统一资源定位符信息,确定每个统一资源定位符信息对应标识信息;第二确定单元,用于针对确定的每个统一资源定位符信息对应的标识信息,判断是否存在该确定的标识信息;删减单元,用于删除筛分单元中重复多余的重复信息与已存在的标识信息;确定采集单元,用于根据列表页所属网页的标准更新率,确定针对列表页当前数据信息采集与下一次数据信息采集的时间间隔;存储单元,用于存放标识信息;压缩单元,用于压缩所述存储单元内的标识信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州亿垒科技有限公司,未经贵州亿垒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201620765180.7/,转载请声明来源钻瓜专利网。
- 上一篇:航道测绘成果管理系统
- 下一篇:一种高效高可靠性的橡塑领域展示系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置