[发明专利]一种文件检测方法、装置、设备及存储介质在审
申请号: | 202110657079.5 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113282921A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 郭开 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 张金香 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 检测 方法 装置 设备 存储 介质 | ||
本申请公开了一种文件检测方法、装置、设备及存储介质。该方法的步骤包括:获取待检测文件;通过文件检测模型对待检测文件执行检测操作;其中,文件检测模型基于恶意广告文件样本以及恶意广告文件样本中数字签名对应的信誉度信息训练生成;获取文件检测模型检测待检测文件得到的文件检测结果。文件检测模型将广告文件的信誉度信息,作为检测广告文件是否为恶意广告文件的维度之一,进而即使恶意广告文件中的代码发生变化,文件检测模型也能够根据其数字签名表征所对应的信誉度信息实现对恶意广告文件的识别检测,能够相对确保文件检测的准确性。此外,本申请还提供一种文件检测装置、设备及存储介质,有益效果同上所述。
技术领域
本申请涉及网络安全领域,特别是涉及一种文件检测方法、装置、设备及存储介质。
背景技术
随着互联网的发展,用户对在互联网中文件的安全性的要求也越来越高。恶意广告文件往往会在客户的系统操作界面中恶意弹窗,因此需要被客户主机检测识别并禁止运行。目前,大部分的文件检测系统往往是通过恶意广告文件样本训练得到的检测模型对待检测文件进行检测,即病毒查杀,以此判定待检测广告文件是否为恶意广告文件。
然而,采用基于恶意广告文件样本训练得到的检测模型对待检测文件进行检测,一旦恶意广告文件稍微变化或者面对出现最新的恶意广告文件,文件检测系统往往会漏报,难以确保文件检测的准确性。
由此可见,提供一种文件检测方法,以相对确保文件检测的准确性,是本领域技术人员需要解决的问题。
发明内容
本申请的目的是提供一种文件检测方法、装置、设备及存储介质,以相对确保文件检测的准确性。
为解决上述技术问题,本申请提供一种文件检测方法,包括:
获取待检测文件;
通过文件检测模型对待检测文件执行检测操作,得到文件检测结果;其中,文件检测模型基于恶意广告文件样本以及恶意广告文件样本中数字签名对应的信誉度信息训练生成,所述文件检测结果用于表征所述待检测文件是否为恶意广告文件。
优选地,恶意广告文件样本的文件来源为网络来源。
优选地,文件检测模型基于恶意样本集合中的恶意广告文件样本以及恶意广告文件样本中数字签名的信誉度信息训练生成;
恶意样本集合包括:默认恶意广告文件样本、以及未知类型样本中与默认恶意广告文件样本的相似度达到预设相似度标准的待扩充样本。
优选地,相似度为未知类型样本与默认恶意广告文件样本之间的模糊哈希值的相似度。
优选地,文件检测模型具体是基于恶意广告文件样本的样本属性标签以及恶意广告文件样本中数字签名对应的信誉度信息训练生成。
此外,本申请还提供一种文件检测模型训练方法,包括:
确定恶意样本集合;
统计恶意样本集合中恶意广告文件样本中数字签名对应的信誉度信息;
基于恶意广告文件样本以及信誉度信息进行模型训练,得到文件检测模型。
优选地,确定恶意样本集合,包括:
获取原始恶意样本集合以及未知类型样本;其中,原始恶意样本集合中包含有默认恶意广告文件样本;
确定未知类型样本中与默认恶意广告文件样本的相似度达到预设相似度标准的待扩充样本;
将待扩充样本增加至原始恶意样本集合,得到恶意样本集合。
优选地,基于恶意广告文件样本以及信誉度信息进行模型训练,包括:
基于恶意广告文件样本的样本属性标签以及信誉度信息进行模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110657079.5/2.html,转载请声明来源钻瓜专利网。