[发明专利]一种基于机器学习的安卓隐私泄露检测方法及系统在审
申请号: | 202210482782.1 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114996701A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 赵春蕾;步志亮;宫良一;王嬉;杨艺;李梅彤 | 申请(专利权)人: | 天津理工大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
代理公司: | 天津市君砚知识产权代理有限公司 12239 | 代理人: | 程昊 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 隐私 泄露 检测 方法 系统 | ||
一种基于机器学习的安卓隐私泄露检测方法,通过对安卓应用软件进行静态和动态分析,提取敏感权限特征以及与隐私泄露高度相关的敏感API特征,对提取出的特征进行向量化处理后输入Stacking模型进行训练,最后优化Stacking模型两层架构,得到较优参数,能有效检测出具有隐私泄露风险的安卓应用软件,该方法的系统由数据集获取模块、关键特征选取模块、安卓应用软件特征提取以及预处理模块和Stacking集成学习训练模块构成;与传统手动检测方法相比提高了检测效率,解决了静态检测在安卓应用软件加壳后获取不到源码的问题,同时弥补了动态检测效率低的不足。
【技术领域】
本发明涉及网络安全技术领域,具体描述一种基于机器学习的安卓隐私泄露检测方法及系统。
【背景技术】
安卓系统是移动设备中使用最为广泛的操作系统,安卓手机的普及在一定程度上促进了安卓应用软件的发展。但由于软件数量十分庞大且应用市场缺少严格的管理制度,导致大量应用软件在上架之前未能进行充分的安全检测,致使许多恶意软件涌入市场。现阶段用户会将大量的敏感信息储存在手机的应用软件中,恶意软件的存在使得用户的敏感信息极容易被泄露,给用户的隐私安全造成一定的威胁。
安卓隐私泄露检测方法主要分为静态分析检测和动态分析检测。静态分析对应用软件的源码以及字节进行分析,但现阶段开发人员会对恶意软件进行加壳以及混淆操作,导致静态分析检测方法的检测率降低。动态分析一般采取动态污点分析方法,不再需要获取软件源码,只需动态运行软件,即可实时监控软件是否产生危险行为。该方法可以有效检测敏感信息的泄露。动态污点分析的弊端也很明显,该技术需要修改安卓底层系统源码,并且需根据不同安卓版本进行调整,不易部署。传统的安卓隐私泄露检测多为小样本检测,缺乏面向应用市场的针对大批量软件的检测方法。因此,安卓隐私泄露检测需要更精确的特征提取方法和更优的检测模型。
【发明内容】
本发明的目的在于提供一种基于机器学习的安卓隐私泄露检测方法及系统,该方法简单且容易实现,它能够克服现有技术的不足,将静态分析、动态执行和机器学习等方法进行结合,来检测应用软件是否具有隐私泄露的风险,从而更好的保护安卓用户的隐私;系统结构简单容易实现。
本发明的技术方案:一种基于机器学习的安卓隐私泄露检测方法,其特征在于它包括以下步骤:
(1)收集安卓应用软件样本,筛选与隐私泄露相关的关键特征;
所述步骤(1)中安卓应用软件样本是由两部分构成;其中一部分是利用爬虫方法在应用商店获取的安卓应用软件,另一部分是工信部所发布的违规安卓应用软件名单中具有隐私泄露风险的样本;并在此样本集中随机划分出样本集的70%作为训练数据集,30%作为测试集。
所述步骤(1)中的筛选具体是指:从收集到的安卓应用软件样本中随机抽取30%的样本集,收集安卓应用软件权限信息,将安卓应用软件权限按照被调用频率从高到低进行排序,并与安卓官方所声明的24个危险级别权限进行对比,确定敏感权限特征信息,选取与隐私数据相关的API(Application Programming Interface,应用软件接口)和与敏感权限特征信息相关的API,确定敏感API特征信息,将筛选后的敏感权限特征信息和敏感API特征信息作为本检测方法的关键特征。
(2)对步骤(1)筛选后的特征进行提取和处理,进行向量化表示;
所述步骤(2)具体是指:提取安卓应用软件的关键特征,使用AAPT(Android AssetPackaging Tool,Android资源打包工具)工具获取安卓应用软件所申请的权限信息,动态安装运行安卓应用软件,使用Xposed框架进行实时监控,截获并记录安卓应用软件的敏感API特征信息,再使用One-Hot编码方法对截获的敏感权限特征信息和敏感API特征信息进行向量化表示。
所述步骤(2)中使用AAPT工具获取权限信息具体是指:使用AAPT中的“aapt dpermissions”语句获取安卓应用软件的权限列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210482782.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便捷鱼刺钳
- 下一篇:一种利用可自持智能反射面提高广播通信传输性能的方法