[发明专利]宏病毒识别方法、装置、存储介质及处理器有效
申请号: | 201810905117.2 | 申请日: | 2018-08-09 |
公开(公告)号: | CN109063482B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 丁亢;李小青;谭国苹 | 申请(专利权)人: | 博彦科技股份有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡;董文倩 |
地址: | 100193 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 宏病毒 识别 方法 装置 存储 介质 处理器 | ||
本发明公开了一种宏病毒识别方法、装置、存储介质及处理器。其中,该方法包括:获取待检测文件的待检测宏程序;使用决策模型对待检测宏程序进行分析,识别待检测宏程序是否为病毒宏程序,其中,决策模型为使用多组训练数据通过机器学习算法训练出的,多组训练数据包括第一类数据和第二类数据,第一类数据中的每组训练数据均包括:病毒宏程序和标识该宏程序为病毒的标签;第二类数据中的每组训练数据均包括:非病毒宏程序和标识该宏程序不为病毒的标签;在确定待检测宏程序属于病毒宏程序的情况下,确定待检测宏程序对应待检测文件为病毒文件。本发明解决了现有宏病毒识别效率低的技术问题。
技术领域
本发明涉及网络安全领域,具体而言,涉及一种宏病毒识别方法、装置、存储介质及处理器。
背景技术
目前,在进行宏病毒查杀的过程中所使用的传统方案是,通过传统特征提取技术,提取宏病毒的特征码,并存入数据库。在病毒检测时,提取需要进行病毒检测的文件中的宏程序,并将该宏程序与数据库中的特征进行匹配,以此来判定文件中是否存在病毒。
但是,通过上述方案提取的特征,通常只能针对于特定的病毒家族,以及该病毒家族的变种,容易被病毒作者绕过。
另外,提取宏病毒的工作需要训练有素的病毒分析人员来完成,因此,传统的宏病毒查杀技术需要投入较多人力才能实现对宏病毒的识别,导致宏病毒的识别效率低,进而影响宏病毒的查杀效率。
针对上述现有宏病毒识别效率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种宏病毒识别方法、装置、存储介质及处理器,以至少解决现有宏病毒识别效率低的技术问题。
根据本发明实施例的一个方面,提供了一种宏病毒识别方法,包括:获取待检测文件的待检测宏程序;使用决策模型对所述待检测宏程序进行分析,识别所述待检测宏程序是否为病毒宏程序,其中,所述决策模型为使用多组训练数据通过机器学习算法训练出的,所述多组训练数据包括第一类数据和第二类数据,所述第一类数据中的每组训练数据均包括:病毒宏程序和标识该宏程序为病毒的标签;所述第二类数据中的每组训练数据均包括:非病毒宏程序和标识该宏程序不为病毒的标签;在确定所述待检测宏程序属于病毒宏程序的情况下,确定所述待检测宏程序对应所述待检测文件为病毒文件。
进一步地,获取待检测文件的待检测宏程序包括:获取待检测文件集合,其中,所述待检测文件集合中包括至少一个文件;识别所述待检测文件集合中存在宏程序的文件为所述待检测文件。
进一步地,获取待检测文件的待检测宏程序包括:判断每个所述待检测文件中的宏程序是否为多个;在所述待检测文件的宏程序为多个的情况下,将同一个所述待检测文件中的多个宏程序整合为一个所述待检测宏程序。
进一步地,所述决策模型通过以下方式训练得出:从预定病毒库中提取病毒文件中的病毒宏程序和非病毒文件中的非病毒宏程序作为样本集数据,其中,所述样本集数据包括:训练集数据和测试集数据;使用所述训练集数据中的多组所述病毒宏程序和所述非病毒宏程序通过机器学习得到训练模型;使用所述测试集数据中的多组所述病毒宏程序和所述非病毒宏程序对所述训练模型的准确性进行验证;在所述训练模型的验证结果为准确的情况下,确定所述训练模型为所述决策模型;在所述训练模型的验证结果为不准确的情况下,根据所述验证结果调整所述训练模型。
根据本发明实施例的另一个方面,提供了一种宏病毒识别装置,包括:获取单元,用于获取待检测文件的待检测宏程序;识别单元,用于使用决策模型对所述待检测宏程序进行分析,识别所述待检测宏程序是否为病毒宏程序,其中,所述决策模型为使用多组训练数据通过机器学习算法训练出的,所述多组训练数据包括第一类数据和第二类数据,所述第一类数据中的每组训练数据均包括:病毒宏程序和标识该宏程序为病毒的标签;所述第二类数据中的每组训练数据均包括:非病毒宏程序和标识该宏程序不为病毒的标签;确定单元,用于在确定所述待检测宏程序属于病毒宏程序的情况下,确定所述待检测宏程序对应所述待检测文件为病毒文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博彦科技股份有限公司,未经博彦科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810905117.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种风险检测方法和装置
- 下一篇:一种基于路径追踪的漏洞检测方法及系统