[发明专利]网络可信性行为管理中URL快速定位、分类和过滤方法有效
申请号: | 201310092932.9 | 申请日: | 2013-03-21 |
公开(公告)号: | CN103136372A | 公开(公告)日: | 2013-06-05 |
发明(设计)人: | 贾嘉;高上;成鑫;穆慧琳 | 申请(专利权)人: | 陕西通信信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西安创知专利事务所 61213 | 代理人: | 谭文琰 |
地址: | 710075 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种网络可信性行为管理中URL快速定位、分类和过滤方法,步骤一、搜索互联网网页,提取URL并进行分类存储,步骤二、对URL进行编码,得到每一个URL的ID并进行分类标识,步骤三、构建URL快速定位的标准,步骤四、URL匹配,步骤五、URL类别定位,步骤六、URL过滤。本发明设计新颖合理,实现方便,与其他方法相比,在匹配时间上有所提高,同时充分的利用数据库技术进行分析,并且可以对匹配分析结果进行主动的过滤,从而达到URL的快速定位、分类与过滤,性能良好,运行稳定,并且有很高的实时效率,应用范围广,使用效果好,便于推广使用。 | ||
搜索关键词: | 网络 可信 性行为 管理 url 快速 定位 分类 过滤 方法 | ||
【主权项】:
一种网络可信性行为管理中URL快速定位、分类和过滤方法,其特征在于该方法包括以下步骤:步骤一、搜索互联网网页,提取URL并进行分类存储,其具体过程如下:步骤101、采用搜素引擎工具在整个网络中大规模搜索互联网网页,提取搜索到的各个互联网网页中所包含的URL;步骤102、设定网络分类规则并根据设定好的网络分类规则对提取到的所有URL进行分类,得到各个URL的分类类型;步骤103、根据URL的语法格式,从URL的原始地址“scheme://host:port/path”中提取“host”字段,以“host”字段中第一个字符n为数据存储表的行标签,以“host”字段中第二个字符m为数据存储表的列标签,建立N×M张数据存储表,将各个URL和各个URL所对应的分类类型存储到数据存储表中,构建起数据存储数据库;其中,n和M均取A~Z的26个字母和0~9的10个数字中的任意一个,N为n的取值总数且取值为36,M为m的取值总数且取值为36;步骤二、对URL进行编码,得到每一个URL的ID并进行分类标识,其具体过程如下:步骤201、计算“host”字段的长度“len”,将“host”字段、“len”和设定的阀值c作为哈希算法的三个参数,采用哈希算法对步骤101中提取到的所有URL进行统一的编码,得到每一个URL对应的唯一的参数“keyvalue”,并将得到的每一个URL对应的唯一的参数“keyvalue”作为URL的ID;其中,c为自然数且取值范围为0≤c≤23;步骤202、将URL的ID与步骤102中得到的各个URL的分类类型进行对应,将URL的ID划分到相应的URL的分类类型内,进行分类标识并更新步骤103中构建起的数据存储数据库;步骤三、构建URL快速定位的标准,其具体过程为:步骤301、将步骤201中得到的URL的ID作为关键值节点,并将其对应的分类标识作为关键值“idata”;步骤302、以关键值节点和关键值“idata”建立二叉链表,生成二叉树,同时,将关键值节点和关键值“idata”一起生成数据文件,所生成的数据文件即为URL快速定位的标准;步骤四、URL匹配,其具体过程为:步骤401、对用户浏览网页时打开的互联网网页中包含的URL进行分析,从URL的原始地址“scheme://host:port/path”中提取“host”字段,并计算“host”字段的长度“len”;步骤402、将“host”字段、“len”和步骤201中设定的阀值c作为哈希算法的三个参数,采用哈希算法对步骤401中URL进行统一的编码,得到URL对应的唯一的参数“keyvalue”,并将得到的URL对应的唯一的参数“keyvalue”作为URL的ID;步骤五、URL类别定位:将步骤402中URL的ID作为关键值节点,在步骤302中生成的二叉树中进行查找,当在二叉树中查找到所述关键值节点时,将查找到的关键值节点所对应的关键值“idata”作为所述URL的ID所属类别“kind”;步骤六、URL过滤,其具体过程为:步骤601、设定过滤策略并将设定好的过滤策略以一张表的形式进行存储,存储为过滤策略表“policygroup”;步骤602、将步骤五中得到的所述URL的ID所属类别“kind”与过滤策略表“policygroup”中的数据进行对比,当所述URL的ID所属类别“kind”与过滤策略表“policygroup”中的数据相似程度达到70%~100%时就阻断,否则就放行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西通信信息技术有限公司,未经陕西通信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310092932.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种保健药酒的制作方法
- 下一篇:一种基于局部特征聚类的时间序列符号化方法