[发明专利]统一资源定位符匹配处理方法及装置有效
申请号: | 201210584310.3 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103077208A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 张大为 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/12 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 谭磊 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 统一 资源 定位 匹配 处理 方法 装置 | ||
技术领域
本发明涉及通信技术,尤其涉及一种统一资源定位符匹配处理方法及装置。
背景技术
在网络技术中,统一资源定位符(Uniform Resource Locator,简称URL)的匹配可用于多种场景,例如域名系统(Domain Name System,简称DNS)中的域名解析、网络安全技术中的URL分类获取,网页搜索技术中的快速查找等。
现有技术中有的运营商采用的URL的匹配采用的结构为“散列(hash)+二叉排列树(Binary Search Tree,简称BST)+页面数组(page array)”的结构,且URL包括域名(host)部分和页面等,其中散列和BST用于处理域名部分的快速匹配,页面数组用于保存页面的列表,具体的,URL的匹配流程为:对于给定的URL,先计算域名部分的散列值,再根据计算得到的散列值,对给定的URL进行散列处理,获取给定的URL中的字符串,然后查询BST中的节点,并将给定的URL中的字符串依次与BST中的节点中的域名字符串(host string)进行比较,以判断是否匹配到整个URL。
但是由于直接将给定的URL中的字符串依次与BST中的节点中的域名字符串进行比较,因此,当给定的URL中的二级域名及其子域名、页面、目录等分类不相同时,会造成处理逻辑复杂,无法用线性方式依次匹配各级域名。
发明内容
本发明提供一种统一资源定位符匹配处理方法及装置,用于解决难以按域名级别匹配二级域名下各级域名,以及获取各级域名属性信息。
本发明实施例第一方面提供一种统一资源定位符匹配处理方法,包括:
将接收到的URL按级别进行划分,并获取所述URL中的二级域名,或者所述二级域名和所述二级域名下的信息;
对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值;
若获取到所述URL中的二级域名,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,获取第一匹配结果;
若获取到所述URL中的所述二级域名和所述二级域名下的信息,则在所述键值对应的BST中匹配到与所述二级域名对应的节点时,在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果。
结合第一方面,在第一方面的第一种可能的实施方式中,所述二级域名下的信息包括如下一种或者几种的组合:子域名、目录和页面;
其中,所述子域名的级别大于所述目录的级别;所述目录的级别大于所述页面的级别。
结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述对所述二级域名进行散列处理,获取所述二级域名对应的字符串,并根据所述二级域名对应的字符串,获取键值之后,所述方法还包括:
若在所述键值对应的BST中,未搜索到与所述二级域名对应的节点,则在所述键值对应的BST中建立与所述二级域名对应的节点,并分别建立所述二级域名下的信息对应的节点;或者,
若在所述键值对应的BST中搜索到所述二级域名对应的节点,则在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次搜索与所述二级域名下的信息对应的节点,若未搜索到所述二级域名下的信息中的一个信息对应的节点,则建立所述一个信息和低于所述一个信息级别的其它信息对应的节点;
其中,所述二级域名对应的节点包括所述二级域名对应的字符串;所述二级域名下的信息对应的节点包括对应的字符串。
结合第一方面的第二种可能的实施方式,在第一方面的第三种可能的实施方式中,所述方法还包括:
分别在每个节点上添加所述节点对应的属性。
结合第一方面的第一种可能的实施方式,在第一方面的第四种可能的实施方式中,若所述二级域名下的信息包括子域名时,所述方法还包括:
对所述子域名按照分段方式逆序排列;或者,
对所述子域名按照分段方式逆序排列,并对所述子域名的字符串进行逆序排列。
结合第一方面的第一种可能的实施方式,在第一方面的第五种可能的实施方式中,所述在所述二级域名对应节点下的基树中,按照级别从大到小的顺序,依次将所述二级域名下的信息与所述基树中对应的字符串进行匹配,并获取第二匹配结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210584310.3/2.html,转载请声明来源钻瓜专利网。