[发明专利]一种基于深度学习的低俗图片识别方法有效
申请号: | 201810794432.2 | 申请日: | 2018-07-19 |
公开(公告)号: | CN109214275B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 操晓春;赵炜;李京知 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/764;G06V10/82;G06K9/62 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 俞达成 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 低俗 图片 识别 方法 | ||
1.一种基于深度学习的低俗图片识别方法,步骤包括:
获取人体图片数据,标注出人脸、上半身、下半身,训练上下半身检测网络;
将人体图片数据输入至训练好的上下半身检测网络中,得到上下半身区域数据,标注出人脸、上半身、下半身后形成训练集,训练上下半身低俗分类网络;
由训练好的上下半身检测网络、上下半身低俗分类网络构成级联低俗识别网络框架;
将待识别的图片输入至该级联低俗识别网络框架中,通过上下半身检测网络得到上下半身数据,通过上下半身低俗分类网络得到低俗识别得分,识别出低俗图片;
所述低俗识别得分的公式为:
Score=max(Scoreupper,Scorelower);
其中,Scoreupper,Scorelower分别为上下半身区域的低俗识别得分,该得分由上下半身检测网络的softmax输出层获得,范围为0~1,其中,若图片未检测到上半身或下半身区域,取0;
根据低俗识别得分,采用如下低俗分类决策函数f(x)识别出低俗图片:
其中,t为低俗得分判定阈值;f(x)输出值为0或者1,0表示识别为正常图片,1表示识别为低俗图片。
2.如权利要求1所述的方法,其特征在于,所述上下半身检测网络采用物体检测框架,包括faster-rcnn、RFCN检测框架;所述上下半身低俗分类网络采用用于识别低俗图片和正常图片的二分类网络,包括GoogleNet。
3.如权利要求1所述的方法,其特征在于,所述上下半身检测网络对获取到的上下半身检测区域进行打分,若分数大于一检测得分阈值,则该区域确定为检测区域,从而得到所述上下半身区域数据。
4.如权利要求3所述的方法,其特征在于,所述检测得分阈值为根据如下公式得到的一个动态调整的值:
thresh=max(max(score),thresh_base);
其中thresh_base为基本得分阈值,score为检测区域的得分。
5.如权利要求4所述的方法,其特征在于,thresh_base取0.8。
6.如权利要求1或3所述的方法,其特征在于,上下半身数据输入至上下半身低俗分类网络前,先对上下半身区域进行尺寸调整,以对应上下半身低俗分类网络的低俗识别。
7.如权利要求1所述的方法,其特征在于,训练所述上下半身检测网络、上下半身低俗分类网络时,采用困难样本挖掘的方法,步骤包括:
基于上下半身检测网络、上下半身低俗分类网络测试,挖掘容易误判的样本,将其加入训练数据,以进行多次训练;
在训练过程中,根据计算出的损失大小来选择样本,包括:对于上下半身检测网络,生成的区域中选择计算损失最大的批量样本进行训练学习;对于上下半身低俗分类网络,训练时忽略损失小样本,只将剩余样本用于训练时更新权重。
8.一种基于深度学习的低俗图片识别系统,包括存储器和处理器,该存储器存储计算机程序,该程序被配置为由该处理器执行,该程序包括用于执行上述权利要求1至7任一所述方法中各步骤的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810794432.2/1.html,转载请声明来源钻瓜专利网。