[发明专利]在线内容采集有效

专利信息
申请号: 201310394779.5 申请日: 2013-08-30
公开(公告)号: CN103823825A 公开(公告)日: 2014-05-28
发明(设计)人: M·菲格;J·霍尔曼 申请(专利权)人: 埃森哲环球服务有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06Q30/02
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅
地址: 爱尔兰*** 国省代码: 爱尔兰;IE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 在线 内容 采集
【权利要求书】:

1.一种在线内容采集系统,包括:

扫描服务器,用于扫描网站以获取潜在创意统一资源定位符(URL),其中所述扫描和所述获取包括:

解析用于所述网站的网页,

从所解析的网页中标识与用于获取潜在创意URL的预定标准匹配的潜在创意URL,以及

获取与所述预定标准匹配的所述潜在创意URL;

数据储存器,用于储存创意URL;以及

在线内容采集服务器,用于分析所获取的潜在创意URL,其中所述分析包括:

通过将所获取的潜在创意URL与在所述数据储存器中储存的所述创意URL进行比较来确定所获取的潜在创意URL以前是否已经见过,以及

如果所获取的潜在创意URL以前已经见过,则确定所获取的潜在创意URL是否指向创意。

2.根据权利要求1所述的在线内容采集系统,其中所述预定标准包括使用正则表达式来匹配所述潜在创意URL。

3.根据权利要求1所述的在线内容采集系统,其中所述分析还包括:

在确定所获取的潜在创意URL以前是否已经见过之前去除查询参数。

4.根据权利要求1所述的在线内容采集系统,其中所述分析还包括:

如果所获取的潜在创意URL以前没有见过,则下载所获取的潜在创意URL指向的创意。

5.根据权利要求1所述的在线内容采集系统,其中如果所获取的潜在创意URL指向创意,则所述分析还包括:

确定所述在线内容采集服务器是否识别出与所述创意关联的点选URL。

6.根据权利要求1所述的在线内容采集系统,其中如果所获取的潜在创意URL不指向创意,则所述分析还包括:

确定具有查询参数的所获取的潜在创意URL以前是否已经见过。

7.根据权利要求5所述的在线内容采集系统,其中如果所述在线内容采集服务器没有识别出与所述创意关联的所述点选URL,则所述分析还包括:

确定与所述创意关联的网页内容是否包括点选URL。

8.根据权利要求7所述的在线内容采集系统,其中如果与所述创意关联的所述网页内容包括点选URL,则所述分析还包括:

在网页浏览器环境中下载所述点选URL;以及

确定所述点选URL是否为重定向URL。

9.根据权利要求1所述的在线内容采集系统,其中所述分析还包括:

如果所获取的潜在创意URL以前没有见过,则确定所获取的潜在创意URL是否为重定向URL。

10.根据权利要求9所述的在线内容采集系统,其中所述分析还包括:

如果所获取的潜在创意URL为重定向URL,则确定所述重定向URL以前是否已经见过;

如果所述重定向URL以前已经见过,则将与所获取的潜在创意URL关联的所述创意指示为无效;以及

如果所述重定向URL以前没有见过,则下载随后的重定向URL以确定所述随后的重定向URL是否为另一重定向URL。

11.根据权利要求9所述的在线内容采集系统,其中所述分析还包括:

如果所获取的潜在创意URL不为重定向URL,则确定与所获取的潜在创意URL关联的创意是否为FLASH对象或图像;

如果与所获取的潜在创意URL关联的所述创意为FLASH对象或图像,则确定所述FLASH对象或所述图像的宽度和高度是否超过预定阈值;以及

如果与所获取的潜在创意URL关联的所述创意不为FLASH对象或图像,则将与所获取的潜在创意URL关联的所述创意指示为无效。

12.根据权利要求11所述的在线内容采集系统,其中所述预定阈值是5像素。

13.根据权利要求11所述的在线内容采集系统,其中所述分析还包括:

如果所述FLASH对象或所述图像的所述宽度和所述高度超过所述预定阈值,则将与所获取的潜在创意URL关联的所述创意指示为有效;以及

将所获取的潜在创意URL储存在所述数据储存器中以用于与进一步获取的潜在创意URL进行比较。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于埃森哲环球服务有限公司,未经埃森哲环球服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310394779.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top