[发明专利]程序安装包检测方法、装置及电子设备在审
申请号: | 201711461925.6 | 申请日: | 2017-12-28 |
公开(公告)号: | CN107895119A | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 钱吕见;卢加磊 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 北京华沛德权律师事务所11302 | 代理人: | 房德权 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 程序 安装 检测 方法 装置 电子设备 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种程序安装包检测方法、装置及电子设备。
背景技术
随着移动互联网时代的到来,智能手机市场得到广泛发展。与此同时,涉黄的APK手机软件日益猖獗。这类APK手机软件通常包含以下行为:(1)包含色情、暴露的图片或者视频,从而诱导用户点击,引发扣费操作;(2)强制联网,从而偷取流量;(3)发送恶意扣费短信或者私自发短信;(4)安装恶意插件;(5)推送广告;(6)盗取用户信息等等。这些行为严重损害了用户的利益,甚至会造成用户的巨大财产损失。因此,识别这类涉黄的APK手机软件,以及时地提醒、告诫用户,有利于保障用户利益。
现有技术中,对涉黄图像进行检测主要是基于皮肤色彩特征匹配的方法,这种方法仅通过图像中皮肤的百分比判断图像是否涉黄,识别率低,且错误率较高。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的程序安装包检测方法、装置及电子设备。
第一方面,本发明实施例提供了一种程序安装包检测方法,所述方法包括:获取程序安装包中的图像数据;通过预设的第一模型提取每个所述图像数据的特征向量;将所述特征向量输入预设的第二模型,得到每个所述图像数据对应的特征值;根据所得到的特征值判定所述程序安装包是否包含不良图像。
优选的,所述第二模型通过下述方式预先获得:获取图像样本,所述图像样本包括多个第一图像数据和多个第二图像数据,所述多个第一图像数据均对应于预设的第一标签,所述多个第二图像数据均对应于第二标签;通过所述第一模型提取所述图像样本中所有图像数据的特征向量;对所述图像样本中所有图像数据的特征向量进行分类模型训练,得到所述第二模型。
优选的,所述对所述图像样本中所有图像数据的特征向量进行分类模型训练,得到所述第二模型的步骤,包括:利用预设的逻辑回归算法对所述图像样本中所有图像数据的特征向量进行训练,得到逻辑回归分类模型,将所述逻辑回归分类模型作为所述第二模型。
优选的,所述通过所述第一模型提取所述图像样本中所有图像数据的特征向量之前,还包括:将所述图像样本中的所有图像数据均缩放到预设尺寸。
优选的,所述根据所得到的特征值判定所述程序安装包是否包含不良图像的步骤,包括:将得到的所述特征值与预设阈值进行比较,若存在大于所述预设阈值的特征值,则判定所述程序安装包包含不良图像;若不存在大于所述预设阈值的特征值,则判定所述程序安装包不包含不良图像。
优选的,所述第一模型为AlexNet深度学习网络模型。
优选的,所述特征向量为所述图像数据对应的4096维特征向量。
第二方面,本发明实施例提供了一种程序安装包检测装置,所述装置包括:数据获取模块、特征向量提取模块、特征值计算模块和检测模块。数据获取模块,用于获取程序安装包中的图像数据。特征向量提取模块,用于通过预设的第一模型提取每个所述图像数据的特征向量。特征值计算模块,用于将所述特征向量输入预设的第二模型,得到每个所述图像数据对应的特征值。检测模块,用于根据所得到的特征值判定所述程序安装包是否包含不良图像。
优选的,所述装置还包括:样本获取模块、样本特征提取模块和训练模块。样本获取模块,用于获取图像样本,所述图像样本包括多个第一图像数据和多个第二图像数据,所述多个第一图像数据均对应于预设的第一标签,所述多个第二图像数据均对应于第二标签。样本特征提取模块,用于通过所述第一模型提取所述图像样本中所有图像数据的特征向量。训练模块,用于对所述图像样本中所有图像数据的特征向量进行分类模型训练,得到所述第二模型。
优选的,所述训练模块具体用于:利用预设的逻辑回归算法对所述图像样本中所有图像数据的特征向量进行训练,得到逻辑回归分类模型,将所述逻辑回归分类模型作为所述第二模型。
优选的,所述装置还包括:预处理模块,用于将所述图像样本中的所有图像数据均缩放到预设尺寸。
优选的,所述检测模块具体用于:将得到的所述特征值与预设阈值进行比较,若存在大于所述预设阈值的特征值,则判定所述程序安装包包含不良图像,若不存在大于所述预设阈值的特征值,则判定所述程序安装包不包含不良图像。
优选的,所述第一模型为AlexNet深度学习网络模型。
优选的,所述特征向量为所述图像数据对应的4096维特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711461925.6/2.html,转载请声明来源钻瓜专利网。