[发明专利]网站行业类型的分类方法、装置、电子装置和存储介质有效
申请号: | 202110483710.4 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113268691B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 任亚倩;范渊;杨勃 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06K9/62 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 聂磊 |
地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 行业 类型 分类 方法 装置 电子 存储 介质 | ||
本申请涉及一种网站行业类型的分类方法、装置、电子装置和存储介质。其中,该网站行业类型的分类方法包括:获取待识别网站的网站信息,其中,网站信息包括待识别网站的网站名称和与待识别网站对应的网页中的框架图片;根据网站名称,确定待识别网站的第一行业类型;采用预设的图片类型识别模型对框架图片进行处理,得到与框架图片对应的第二行业类型,其中,预设的图片类型识别模型被训练为用于根据框架图片得到与该框架图片对应的行业类型;在第一行业类型中检测第二行业类型,并根据检测结果确定待识别网站的行业类型。通过本申请,解决了相关技术中网站行业类型识别率低的问题,提高了相关技术中网站行业类型识别率。
技术领域
本申请涉及网络安全领域,特别是涉及网站行业类型的分类方法、装置、电子装置和存储介质。
背景技术
在网络安全监控中,常常需要分析确定用户访问了哪些网页,以及网页的行业类型。其中,网站行业类型是指网站有规则的按照一定的科学依据,对该网站所从事和经营的模式来进行详细的类型划分。网站行业类型一般来说分为以下几种类型:金融网站、教育网站、个人网站、企业网站、社区网站等。一般来说每种类型的网站都有相似的网站结构和经营模式。
现有网站行业类型识别中,一般都是采用单一的html关键字来识别,这种方式关键字识别方式单一,错误率高,需要人工二次验证与错误数据分析,这增加了人工成本,使得网站行业类型识别率低。
目前针对相关技术中网站行业类型识别率低的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种网站行业类型的分类方法、装置、电子装置和存储介质,以至少解决相关技术中网站行业类型识别率低的问题。
第一方面,本申请实施例提供了一种网站行业类型的分类方法,包括:
获取待识别网站的网站信息,其中,所述网站信息包括待识别网站的网站名称和与所述待识别网站对应的网页中的框架图片;
根据所述网站名称,确定所述待识别网站的第一行业类型;
采用预设的图片类型识别模型对所述框架图片进行处理,得到与所述框架图片对应的第二行业类型,其中,所述预设的图片类型识别模型被训练为用于根据框架图片得到与该框架图片对应的行业类型;
在所述第一行业类型中检测所述第二行业类型,并根据检测结果确定所述待识别网站的行业类型。
在其中一些实施例中,在所述第一行业类型中检测所述第二行业类型,并根据检测结果确定所述待识别网站的行业类型包括:
在所述第一行业类型中检测到所述第二行业类型的情况下,确定所述待识别网站的行业类型包括所述第二行业类型;
在所述第一行业类型中未检测到所述第二行业类型的情况下,确定所述待识别网站的行业类型包括所述第一行业类型。
在其中一些实施例中,在所述第一行业类型中检测到所述第二行业类型的情况下,确定所述待识别网站的行业类型包括所述第二行业类型包括:
根据所述第二行业类型验证所述第一行业类型,并在所述第二行业类型验证所述第一行业类型为验证成功的情况下,确定所述待识别网站的行业类型包括所述第二行业类型。
在其中一些实施例中,在所述第一行业类型中未检测到所述第二行业类型的情况下,确定所述待识别网站的行业类型包括所述第一行业类型包括:
根据所述第二行业类型验证所述第一行业类型,并在所述第二行业类型验证所述第一行业类型为未验证成功的情况下,确定所述待识别网站的行业类型包括所述第一行业类型。
在其中一些实施例中,所述第一行业类型中未检测到所述第二行业类型的情况下,确定所述待识别网站的行业类型包括所述第一行业类型还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110483710.4/2.html,转载请声明来源钻瓜专利网。