[发明专利]一种Android应用威胁度评估模型建立方法、评估方法及系统在审
| 申请号: | 201810457339.2 | 申请日: | 2018-05-14 |
| 公开(公告)号: | CN108717511A | 公开(公告)日: | 2018-10-30 |
| 发明(设计)人: | 刘超;喻民;李松;姜建国;黄伟庆 | 申请(专利权)人: | 中国科学院信息工程研究所 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
| 地址: | 100093 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征向量 聚类算法 评估模型 特征选择 机器学习算法 分类算法 模型建立 权限信息 特征数据 训练样本 威胁 应用 评估 字典 特征向量集 预处理算法 分类结果 数据降维 特征信息 状态构建 普适性 分类 聚类 预设 算法 | ||
1.一种Android应用威胁度评估模型建立方法,其特征在于,包括:
根据预设的预处理算法提取训练样本的特征数据,所述训练样本包括恶意应用和良性应用,所述特征数据包括权限信息和附加特征信息,并根据所述特征数据的状态构建特征向量;
利用聚类算法,根据所述权限信息对所述训练样本的特征向量集进行聚类,将所述特征向量集分为不同的特征向量簇,得到聚类算法模型;
以所述特征向量簇为单位,利用数据降维算法对所述特征向量簇中所述特征向量进行特征选择,并得到与所述特征向量簇对应的特征选择字典;
对所述特征向量簇中所述特征向量使用预设的机器学习算法进行分类,所述机器学习算法为多个;根据分类结果获取各个所述机器学习算法的预设指标;根据所述预设指标获取与所述特征向量簇对应的所述机器学习算法,得到分类算法模型;
根据所述预处理算法、所述聚类算法模型、所述特征选择字典和所述分类算法模型建立Android应用威胁度评估模型。
2.根据权利要求1所述的方法,其特征在于,所述附加特征信息具体包括:敏感API信息、敏感字符串信息、组件activity信息、组件Broadcast Receiver信息以及native代码信息、动态代码信息、加密代码信息和反射代码信息;其中,所述组件activity信息和所述组件Broadcast Receiver信息包括action信息。
3.根据权利要求1所述的方法,其特征在于,在所述得到与所述特征向量簇对应的特征选择字典之后,所述对所述特征向量簇中所述特征向量使用预设的机器学习算法进行分类之前,所述方法还包括:
对所述特征向量集进行数据标准化处理。
4.根据权利要求1所述的方法,其特征在于,所述聚类算法包括K-means算法。
5.根据权利要求1所述的方法,其特征在于,所述数据降维算法包括PCA或LDA。
6.根据权利要求1所述的方法,其特征在于,所述预设的机器学习算法包括NearestNeighbors、Linear SVM、RBF SVM、Decision Tree、Random Forest、AdaBoost、LogisticRegression、GradientBoostingClassifier和MLPClassifier。
7.一种基于权利要求1~6任一所述的Android应用威胁度评估模型的Android应用威胁度评估方法,其特征在于,包括:
接收待处理应用;
提取所述待处理应用的所述特征数据,所述特征数据包括所述权限信息和所述附加特征信息,根据所述特征数据的状态构建特征向量;
将所述权限信息输入到所述聚类算法模型,对所述待处理应用进行预分类,得到与所述待处理应用对应的所述特征向量簇;
根据与所述待处理应用对应的所述特征向量簇获取所述特征选择字典,根据所述特征选择字典对所述特征向量进行特征选择;
根据与所述待处理应用对应的所述特征向量簇获取与所述特征向量簇对应的所述机器学习算法,对所述特征向量使用所述机器学习算法进行分类,根据分类结果评估所述待处理应用的威胁度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810457339.2/1.html,转载请声明来源钻瓜专利网。





