[发明专利]一种识别缓存文件的方法及装置有效

专利信息
申请号: 201310308214.0 申请日: 2013-07-22
公开(公告)号: CN103347092A 公开(公告)日: 2013-10-09
发明(设计)人: 白宇 申请(专利权)人: 星云融创(北京)信息技术有限公司
主分类号: H04L29/08 分类号: H04L29/08
代理公司: 北京思睿峰知识产权代理有限公司 11396 代理人: 赵爱军
地址: 100080 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 识别 缓存 文件 方法 装置
【说明书】:

技术领域

发明涉及互联网领域,特别涉及一种识别缓存文件的方法及装置。

背景技术

web代理网关可以通过缓存网站静态文件(资源)来达到对网站进行加速的目的,传统的web代理网关一般是通过文件名后缀来识别文件类型,并根据识别出的文件类型来确定是否要对文件进行缓存,如ajpg、b.png被识别为图片文件,为可缓存文件。

但是,网站出于对内容的保护,有时候会去掉文件的文件名后缀进行传输,传统的web代理网关就不能对此类文件进行缓存加速。另外,有些网站出于某些目的(或者出错),实际传输的文件内容并不是文件名后缀标识的文件类型,这种情况传统的web代理就有可能会对不应该缓存的文件进行缓存,而导致违背源站的目的。

可见,传统的web代理网关通过文件后缀进行判断是否需要对文件进行缓存,而没有文件名后缀的可以缓存资源就会被遗漏,同时当文件名后缀标识的文件类型和文件内容不相符的时候也不能进行验证。

发明内容

有鉴于此,本发明的目的是提供一种识别缓存文件的方法及装置,以提高对传输的数据文件的文件类型识别的准确性,进而提高对文件进行缓存的准确性。

为实现上述目的,本发明提供技术方案如下:

一种识别缓存文件的方法,应用于web代理网关中,所述方法包括:

A、根据文件名后缀和/或http头中的Content-Type字段内容,对http数据中承载的数据文件的文件类型进行初步识别,当通过所述初步识别得到了所述数据文件的文件类型时,进入步骤B,当通过所述初步识别未能得到所述数据文件的文件类型时,进入步骤C;

B、根据所述数据文件的文件头部对所述初步识别得到的文件类型进行验证,当验证结果正确时,将所述初步识别得到的文件类型确定为真正文件类型,进入步骤D,当验证结果错误时,进入步骤C;

C、根据所述数据文件的文件头部确定所述数据文件的真正文件类型;

D、根据所述数据文件的真正文件类型确定所述数据文件是否为可缓存文件。

上述的方法,步骤B中,根据所述数据文件的文件头部对所述初步识别得到的文件类型进行验证,具体包括:

将所述数据文件的文件头部与所述初步识别得到的文件类型的内容特征进行匹配,匹配成功时,确定验证结果正确,匹配失败时,确定验证结果错误。

上述的方法,步骤C具体包括:

将所述数据文件的文件头部依次与已知文件类型库中的每种文件类型的内容特征进行匹配,并将匹配到的文件类型作为所述数据文件的真正文件类型。

上述的方法,步骤C中,将所述数据文件的文件头部优先与图片文件的内容特征进行匹配。

一种识别缓存文件的装置,应用于web代理网关中,所述装置包括:

第一识别单元,用于根据文件名后缀和/或http头中的Content-Type字段内容,对http数据中承载的数据文件的文件类型进行初步识别,当通过所述初步识别得到了所述数据文件的文件类型时,触发验证单元,当通过所述初步识别未能得到所述数据文件的文件类型时,触发第二识别单元;

验证单元,用于根据所述数据文件的文件头部对所述初步识别得到的文件类型进行验证,当验证结果正确时,将所述初步识别得到的文件类型确定为真正文件类型,触发缓存识别单元,当验证结果错误时,触发第二识别单元;

第二识别单元,用于根据所述数据文件的文件头部确定所述数据文件的真正文件类型;

缓存识别单元,用于根据所述数据文件的真正文件类型确定所述数据文件是否为可缓存文件。

上述的装置,其中,所述验证单元进一步用于:

将所述数据文件的文件头部与所述初步识别得到的文件类型的内容特征进行匹配,匹配成功时,确定验证结果正确,匹配失败时,确定验证结果错误。

上述的装置,其中,所述第二识别单元进一步用于:

将所述数据文件的文件头部依次与已知文件类型库中的每种文件类型的内容特征进行匹配,并将匹配到的文件类型作为所述数据文件的真正文件类型。

上述的装置,其中,所述第二识别单元将所述数据文件的文件头部优先与图片文件的内容特征进行匹配。

本发明通过结合http头中的Content-Type字段内容以及http数据流来进行文件类型识别的综合判断,能够准确获知当前传输的文件类型,从而达到对可以缓存文件不遗漏的目的,并能够防止对不应该缓存的文件错误的进行缓存。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星云融创(北京)信息技术有限公司,未经星云融创(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310308214.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top