[发明专利]一种基于深度学习的二进制代码相似度检测方法在审
申请号: | 202110855101.7 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113554101A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 耿晓旭;邱景 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/901;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 二进制 代码 相似 检测 方法 | ||
本发明提出了一种基于深度学习的二进制代码相似度检测方法,针对传统图匹配算法在二进制代码相似度检测方面存在不适应跨架构跨版本以及面对较大函数体时时间复杂度较高的问题,本发明提出了一种新的图嵌入表示模型用来表示二进制函数,从而通过计算二进制函数的嵌入值来计算二进制函数之间的相似度。本发明对相较于传统二进制代码相似度计算方法进行了以下三个方面的改进:(1)使用Structure2Vec来生成二进制函数的控制流图的图嵌入。(2)引入CNN来处理控制流图基本块间的顺序结构信息,从而更好的明确函数内部块间的先后关系。(3)融合前两部分特征,形成二进制函数最终的嵌入值表示,最后通过暹罗架构计算函数之间的相似度。实验结果表明本发明的方法可行且有效,既提高了相似度检测工作的效率,又能够很好的适应跨架构和跨版本相似度检测工作。
技术领域
本发明涉及二进制代码相似度检测技术领域,尤其涉及一种基于深度学习的二进制代码相似度检测方法。
背景技术
人工分析二进制代码来寻找漏洞函数是一件效率极低且需要耗费大量时间和人力的工作,因此需要开发一种自动化的工具减少人工的参与。当前的主流方法是以二进制代码的控制流图为依托来进行的,首先生成与二进制函数对应的控制流图,之后使用图匹配算法来检测两个二进制函数对应的控制流图的相似度。然而该类方法在面对图形结构较为复杂的控制流图时,则需要耗费较多的时间来比较,这在工程领域是不被允许的。因此Genius对这类方法进行了改进,将控制流图中的每个块的原始特征转换为高级数字特征向量,每个函数被转换为更高级别的数字特征,这样处理后的特征更加具有鲁棒性,但是仍需要通过图匹配算法来计算相似性.这类二进制代码相似度检测工作存在着一些弊端:(1)部分方法采用时间复杂度极高的算法(例如图匹配算法),这类方法耗时严重。(2)部分方法对于跨架构和跨版本的适应性较差。
近年来,机器学习在各个领域中得到广泛的应用和发展,因此将机器学习应用于二进制代码相似度检测领域也是未来发展的趋势。Gemini使用图嵌入的方案,结合Genius中的特征提取方法,将二进制函数的表示方法转为嵌入值来表示,该方法对于特征的提取速度明显优于Genius,而且二进制函数的控制流图的相似度计算也不再使用效率较低的图匹配算法来完成,而是直接计算两个图嵌入之间的相似度来完成。该方法对于相似度的计算速度和准确率有了极大幅度的提升,即使是面对新的问题环境,也能够通过快速的二次训练达到较为理想的效果。虽然Gemini应用了图嵌入的知识来完成了对于二进制函数的表示,但是由于图嵌入处理的都是无向图,而函数的控制流图是有向图,所以该方法会丢失掉这部分的顺序结构信息,从而引起检测中的部分偏差。
发明内容
有鉴于此,本发明的目的是提供一种基于深度学习的二进制代码相似度检测方法,并将其应用于具有挑战性二进制代码相似度检测方面,以解决上述现有技术存在的问题,在提高检测精度的同时提高检测效率,且面对跨架构跨版本的数据同样具有极好的效果。
为实现上述目的,本发明提供了如下方案:一种基于深度学习的二进制代码相似度检测模型,包括:
构建控制流程图生成模块,用于构建二进制代码对应的控制流程图;
构建基于Structure2Vec的图结构信息嵌入值生成模块,用于获取二进制代码控制流程图对应的图结构信息嵌入值;
构建基于CNN的图顺序信息嵌入值生成模块,用于获取二进制代码控制流程图对应的图顺序信息嵌入值;
构建基于全连接神经网络的特征融合模块,用于融合图结构信息和图顺序信息,生成函数对应的控制流程图的最终嵌入值表示形式;
构建基于暹罗架构的相似度检测模块,用于获取函数对应嵌入值之间的相似度,生成最终的相似度判定结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110855101.7/2.html,转载请声明来源钻瓜专利网。