[发明专利]一种URL的聚类方法及装置有效
申请号: | 201610675697.1 | 申请日: | 2016-08-16 |
公开(公告)号: | CN106294815B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 汤奇峰;方炜超 | 申请(专利权)人: | 晶赞广告(上海)有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张振军;吴敏 |
地址: | 200072 上海市闸北区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种URL的聚类方法及装置,所述方法包括:获取URL数据集,所述URL数据集包括多条URL,所述多条URL隶属于至少一个域名;分别对每个域名下的URL进行分割处理,并根据分割处理得到的字段的统计结果确定每个域名对应的多个热门字段;针对每个域名下的URL,对包括该域名对应的热门字段的URL,根据该域名对应的热门字段进行聚类,得到每个域名对应的第一聚类结果;针对每个域名下的URL,对不包括该域名对应的热门字段的URL进行聚类,得到每个域名对应的第二聚类结果。上述方案可提升网络系统资源的利用率。 | ||
搜索关键词: | 一种 url 方法 装置 | ||
【主权项】:
1.一种URL的聚类方法,其特征在于,包括:获取URL数据集,所述URL数据集包括多条URL,所述多条URL隶属于至少一个域名;分别对每个域名下的URL进行分割处理,并根据分割处理得到的字段的统计结果确定每个域名对应的多个热门字段;针对每个域名下的URL,对包括该域名对应的热门字段的URL,根据该域名对应的热门字段进行聚类,得到每个域名对应的第一聚类结果;针对每个域名下的URL,对不包括该域名对应的热门字段的URL进行聚类,得到每个域名对应的第二聚类结果;对于所述第一聚类结果和所述第二聚类结果,将其中URL数量超过第一预设阈值的聚类类别进行拆分,并将其中URL数量小于第二预设阈值的聚类类别进行合并,所述第一预设阈值大于所述第二预设阈值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于晶赞广告(上海)有限公司,未经晶赞广告(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610675697.1/,转载请声明来源钻瓜专利网。
- 上一篇:汽车座垫(2)
- 下一篇:彩泥紫砂壶(天宝壶)