[发明专利]一种网页分类的确定方法及装置在审
申请号: | 201710326233.4 | 申请日: | 2017-05-10 |
公开(公告)号: | CN107545020A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 张惊申;卢俞虹;任方英 | 申请(专利权)人: | 新华三信息安全技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙)11413 | 代理人: | 马敬,项京 |
地址: | 230001 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 分类 确定 方法 装置 | ||
1.一种网页分类的确定方法,其特征在于,所述方法包括:
确定待分类网页;
获得所述待分类网页的外链网页,其中,所述外链网页为:网页内容中存在所述待分类网页的地址的网页;
按照预设的分类方式,确定各个外链网页的参考分类;
根据所确定的各个外链网页的参考分类,确定所述待分类网页的分类。
2.根据权利要求1所述的方法,其特征在于,所述获得所述待分类网页的外链网页的步骤,包括:
从预设的外链网页关系库中获得所述待分类网页的外链网页;其中,所述外链网页关系库,用于存储各个网页及对应的外链网页。
3.根据权利要求2所述的方法,其特征在于,所述按照预设的分类方式,确定各个外链网页的参考分类的步骤,包括:
获得各个外链网页的地址,从各个外链网页的地址中提取对应的地址特征,根据所获得的地址特征以及预设的地址特征与分类的对应关系,确定各个外链网页的参考分类;或者,
获得各个外链网页对应的网页信息,根据所获得的网页信息以及预设的分类字典,确定各个外链网页的参考分类。
4.根据权利要求3所述的方法,其特征在于,所述根据所确定的各个外链网页的参考分类,确定所述待分类网页的分类的步骤,包括:
将所确定的各个外链网页的参考分类确定为所述待分类网页的分类;或者,
确定所述分类字典中每一个分类在第一参考分类组中的第一出现次数,所述第一参考分类组包括所确定的各个外链网页的参考分类,将第一出现次数值最大的分类确定为所述待分类网页的分类;或者,
获得各个外链网页对应的网站权重,将所获得的网站权重确定为各个外链网页的权重,并根据所确定的各个外链网页的参考分类和各个外链网页的权重,确定所述待分类网页的分类。
5.根据权利要求1所述的方法,其特征在于,所述根据所确定的各个外链网页的参考分类,确定所述待分类网页的分类的步骤,包括:
按照所述分类方式,确定所述待分类网页的参考分类;
根据所确定的各个外链网页的参考分类和所述待分类网页的参考分类,确定所述待分类网页的分类。
6.根据权利要求5所述的方法,其特征在于,所述根据所确定的各个外链网页的参考分类和所述待分类网页的参考分类,确定所述待分类网页的分类的步骤,包括:
确定所述分类字典中每一个分类在第二参考分类组中的第二出现次数,所述第二参考分类组包括各个外链网页的参考分类和所述待分类网页的参考分类,将第二出现次数值最大的分类确定为所述待分类网页的分类。
7.一种网页分类的确定装置,其特征在于,所述装置包括:
网页确定模块,用于确定待分类网页;
外链获得模块,用于获得所述待分类网页的外链网页,其中,所述外链网页为:网页内容中存在所述待分类网页的地址的网页;
参考确定模块,用于按照预设的分类方式,确定各个外链网页的参考分类;
分类确定模块,用于根据所确定的各个外链网页的参考分类,确定所述待分类网页的分类。
8.根据权利要求7所述的装置,其特征在于,所述外链获得模块,具体用于:
从预设的外链网页关系库中获得所述待分类网页的外链网页;其中,所述外链网页关系库,用于存储各个网页及对应的外链网页。
9.根据权利要求8所述的装置,其特征在于,所述参考确定模块为第一确定模块或者第二确定模块;
所述第一确定模块,用于获得各个外链网页的地址,从各个外链网页的地址中提取对应的地址特征,根据所获得的地址特征以及预设的地址特征与分类的对应关系,确定各个外链网页的参考分类;
所述第二确定模块,用于获得各个外链网页对应的网页信息,根据所获得的网页信息以及预设的分类字典,确定各个外链网页的参考分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三信息安全技术有限公司,未经新华三信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710326233.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种查询故障的处理方法及处理装置
- 下一篇:一种基于可控增益的宽带直流放大器