[发明专利]一种基于机器学习的安卓隐私泄露检测方法及系统在审
| 申请号: | 202210482782.1 | 申请日: | 2022-05-05 |
| 公开(公告)号: | CN114996701A | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 赵春蕾;步志亮;宫良一;王嬉;杨艺;李梅彤 | 申请(专利权)人: | 天津理工大学 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
| 代理公司: | 天津市君砚知识产权代理有限公司 12239 | 代理人: | 程昊 |
| 地址: | 300384 *** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 隐私 泄露 检测 方法 系统 | ||
1.一种基于机器学习的安卓隐私泄露检测方法,其特征在于它包括以下步骤:
(1)收集安卓应用软件样本,筛选与隐私泄露相关的关键特征;
(2)对步骤(1)筛选后的特征进行提取和处理,进行向量化表示;
(3)将根据步骤(2)向量化后的特征信息输入到Stacking模型进行训练,使用五折交叉验证方法降低过拟合的概率,同时优化安卓隐私泄露检测模型,并输出优化后的模型;
(4)根据步骤(2)提取安卓应用软件所申请的敏感权限特征信息和敏感API特征信息,并结合步骤(3)所得到优化后的模型进行安卓隐私泄露检测,判断应用软件是否具有隐私泄露的风险,若模型检测结果为“1”,代表安卓应用软件具有隐私泄露的风险;模型检测结果为“0”,代表安卓应用软件不具有隐私泄露的风险。
2.根据权利要求1所述一种基于机器学习的安卓隐私泄露检测方法,其特征在于所述步骤(1)中安卓应用软件样本是由两部分构成;其中一部分是利用爬虫方法在应用商店获取的安卓应用软件,另一部分是工信部所发布的违规安卓应用软件名单中具有隐私泄露风险的样本;并在此样本集中随机划分出样本集的70%作为训练数据集,30%作为测试集。
3.根据权利要求1所述一种基于机器学习的安卓隐私泄露检测方法,其特征在于所述步骤(1)中的筛选具体是指:从收集到的安卓应用软件样本中随机抽取30%的样本集,收集安卓应用软件权限信息,将安卓应用软件权限按照被调用频率从高到低进行排序,并与安卓官方所声明的24个危险级别权限进行对比,确定敏感权限特征信息,选取与隐私数据相关的API和与敏感权限特征信息相关的API,确定敏感API特征信息,将筛选后的敏感权限特征信息和敏感API特征信息作为本检测方法的关键特征。
4.根据权利要求1所述一种基于机器学习的安卓隐私泄露检测方法,其特征在于所述步骤(2)具体是指:提取安卓应用软件的关键特征,使用AAPT工具获取安卓应用软件所申请的权限信息,动态安装运行安卓应用软件,使用Xposed框架进行实时监控,截获并记录安卓应用软件的敏感API特征信息,再使用One-Hot编码方法对截获的敏感权限特征信息和敏感API特征信息进行向量化表示。
5.根据权利要求4所述一种基于机器学习的安卓隐私泄露检测方法,其特征在于所述使用AAPT工具获取权限信息具体是指:使用AAPT中的“aapt d permissions”语句获取安卓应用软件的权限列表;
所述使用Xposed框架进行实时监控,截获并记录安卓应用软件的敏感API特征信息具体是指:使用Android Studio软件编写Hook模块,向模块中加入Log语句,安卓应用软件调用敏感API特征信息后,模块输出Log语句,进行最终记录;
所述使用One-Hot编码方法对截获的敏感权限特征信息和敏感API特征信息进行向量化表示具体是指:将提取到的安卓应用软件的敏感权限特征信息和安卓应用软件的敏感API特征信息进行One-Hot向量化转换,即:若安卓应用软件申请的权限信息为敏感权限,则此时向量化表示为1;若没有申请敏感权限,则向量化表示为0,将进行One-Hot向量化转换后的特征信息按照敏感权限特征信息在前,敏感API特征信息在后进行排列,形成一个n*1大小的矩阵序列。
6.根据权利要求5所述一种基于机器学习的安卓隐私泄露检测方法,其特征在于所述敏感权限特征信息包括在安卓应用软件的良性应用软件和隐私泄露风险应用软件中被申请频率较高的权限特征、安卓官方声明危险权限特征以及前两者之间的重叠权限特征;
所述敏感API特征信息包括与敏感权限相对应的API、可执行敏感操作的API以及与隐私泄露相关的API;
所述隐私泄露风险安卓应用软件是具有危险级别权限特征的安卓应用软件或具有会造成隐私泄露问题的普通级别权限的安卓应用软件;所述具有危险级别权限特征的安卓应用软件是能够通过获取手机设备信息导致用户个人隐私数据泄露的安卓应用软件,且具有隐私泄露风险的安卓应用软件会申请危险级别的权限;所述具有会造成隐私泄露问题的普通级别权限的安卓应用软件是指利用恶意软件通过申请普通级别权限但存在隐私泄露风险的安卓应用软件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210482782.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便捷鱼刺钳
- 下一篇:一种利用可自持智能反射面提高广播通信传输性能的方法





