[发明专利]基于卷积神经网络的赌博网站识别方法和系统在审
申请号: | 201711070078.0 | 申请日: | 2017-11-03 |
公开(公告)号: | CN108052523A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 陈立国;张跃冬;袁晓彤;耿光刚;延志伟 | 申请(专利权)人: | 中国互联网络信息中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q50/34 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 赌博 网站 识别 方法 系统 | ||
1.一种基于卷积神经网络的赌博网站识别方法,其特征在于,包括以下步骤:
批量获取网站的网页截图;
标注网页截图的类别;
以标注的网页截图作为训练数据,训练卷积神经网络模型;
利用训练好的卷积神经网络模型对待预测网站的网页截图进行识别,判断其是否为赌博网站。
2.如权利要求1所述的方法,其特征在于,对标注的网页截图进行预处理操作,以便于进行模型训练。
3.如权利要求2所述的方法,其特征在于,所述预处理操作包括转灰度操作、缩放操作和/或白化操作。
4.如权利要求1所述的方法,其特征在于,所述获取网站的网页截图包括使用多线程的网页加载渲染工具快速地实现大批量网页的加载和渲染,从而快速的获取网站的网页截图。
5.如权利要求1所述的方法,其特征在于,采用人工方式标注网站网页截图的类别。
6.如权利要求1所述的方法,其特征在于,所述卷积神经网络模型包括:输入层、两层卷积层、两层池化层、扁平化层、两层随机丢弃层和全连接层。
7.一种基于卷积神经网络的赌博网站识别系统,其特征在于,包括:
批量网页截图模块,用于批量获取网站的网页截图;
网站类别标注模块,用于标注网页截图的类别;
模型训练模块,用于以标注的网页截图作为训练数据,训练卷积神经网络模型;
预测模块,用于利用训练好的卷积神经网络模型对待预测网站的网页截图进行识别,判断其是否为赌博网站。
8.如权利要求7所述的系统,其特征在于,还包括截图预处理模块,用于对网站类别标注模块标注的网页截图进行预处理操作,以便于进行模型训练。
9.如权利要求8所述的系统,其特征在于,所述预处理操作包括转灰度操作、缩放操作和/或白化操作。
10.如权利要求7所述的系统,其特征在于,所述批量网页截图模块使用多线程的网页加载渲染工具快速地实现大批量网页的加载和渲染,从而快速的获取网站的网页截图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国互联网络信息中心,未经中国互联网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711070078.0/1.html,转载请声明来源钻瓜专利网。