[发明专利]病毒文件识别方法和装置在审
申请号: | 201711379528.4 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107992750A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 崔同强;李振逢;邹赞 | 申请(专利权)人: | 深圳豪客互联网有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06N99/00 |
代理公司: | 北京华夏泰和知识产权代理有限公司11662 | 代理人: | 朱中华,汤财宝 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病毒 文件 识别 方法 装置 | ||
技术领域
本公开的实施例涉及计算机技术领域,尤其涉及一种病毒文件识别方法和装置。
背景技术
计算机及网络技术的迅猛发展极大地促进了信息交互。但是,与此同时,计算机病毒文件也伴随技术的发展而不断地演化更新,从初期的恶作剧游戏发展到今日,计算机病毒文件已经严重威胁到了人们对计算机的正常使用。由此,如何防范病毒文件侵袭已然成为人们关注的一个焦点。
现有技术中进行病毒文件识别的方式一般是预先建立相应的病毒文件库,并进行病毒文件库进行比对,将与病毒文件库中的病毒文件匹配的文件认定为病毒文件;或者人为的设定相应的规则,符合相应的规则的文件认定为病毒文件。但是这两种方式都需要较多的人工介入,且比较容易出错。
发明内容
本公开至少一个实施例的主要目的在于提供一种新的病毒文件识别方法,可用以减少人工介入。
第一方面,本公开的实施例提供了一种病毒文件识别方法,所述方法包括:
对待识别的文件进行预处理,使得预处理后的文件能够被机器学习模型处理;
根据预先训练好的机器学习模型对完成预处理的文件进行识别。
在一些实施例中,所述方法还包括:
利用预设的学习样本训练所述机器学习模型。
在一些实施例中,所述根据预先训练好的机器学习模型对完成预处理的文件进行识别之后,所述方法还包括:
读取预设的病毒文件识别软件对待识别文件的识别结果;
根据所述识别结果对所述机器学习模型进行调整。
在一些实施例中,所述读取预设的病毒文件识别软件对待识别文件的识别结果,包括:
读取多个预设的病毒文件识别软件的识别结果;
所述根据所述识别结果对所述机器学习模型进行调整,包括:
根据多个预设的病毒文件识别软件的识别结果确定对待识别文件的综合识别结果;
根据所述综合识别结果对所述机器学习模型进行调整。
在一些实施例中,所述根据多个预设的病毒文件识别软件的识别结果确定对待识别文件的综合识别结果,包括:
获取各个病毒文件识别软件对应的病毒文件识别准确率;
根据各个病毒文件识别软件对应的病毒文件识别准确率设置各个病毒文件识别软件对应的识别结果的权重;
根据各个病毒文件识别软件对应的识别结果以及所对应的权重确定综合识别结果。
第一方面,本公开的实施例提供了一种病毒文件识别装置,所述装置包括:
预处理模块,用于对待识别的文件进行预处理,使得预处理后的文件能够被机器学习模型处理;
识别模块,用于根据预先训练好的机器学习模型对完成预处理的文件进行识别。
在一些实施例中,还包括:
训练模块,用于利用预设的学习样本训练所述机器学习模型。
在一些实施例中,还包括:
调整模块,用于根据预先训练好的机器学习模型对完成预处理的文件进行识别之后,读取预设的病毒文件识别软件对待识别文件的识别结果;根据所述识别结果对所述机器学习模型进行调整。
在一些实施例中,所述调整模块,用于读取预设的病毒文件识别软件对待识别文件的识别结果,包括:
读取多个预设的病毒文件识别软件的识别结果;
所述调整模块,用于根据所述识别结果对所述机器学习模型进行调整,包括:
根据多个预设的病毒文件识别软件的识别结果确定对待识别文件的综合识别结果;
根据所述综合识别结果对所述机器学习模型进行调整。
在一些实施例中,所述调整模块,用于根据多个预设的病毒文件识别软件的识别结果确定对待识别文件的综合识别结果,包括:
获取各个病毒文件识别软件对应的病毒文件识别准确率;
根据各个病毒文件识别软件对应的病毒文件识别准确率设置各个病毒文件识别软件对应的识别结果的权重;
根据各个病毒文件识别软件对应的识别结果以及所对应的权重确定综合识别结果。
在本公开至少一个实施例中,根据机器学习模型对计算机病毒文件进行识别,由于计算器学习模型自学习的特点,能够减少病毒文件库建立以及识别规则建立过程中的人工介入,并且有助于提高准确性。
附图说明
图1展示了本公开实施例提供的一种病毒文件识别方法的主要流程;
图2展示了本公开实施例提供的一种病毒文件识别方法的主要结构。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳豪客互联网有限公司,未经深圳豪客互联网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711379528.4/2.html,转载请声明来源钻瓜专利网。