[发明专利]一种泄露代码检索方法、装置及计算机可读存储介质在审
申请号: | 202211296187.5 | 申请日: | 2022-10-21 |
公开(公告)号: | CN115658067A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 裴伟伟;万振华 | 申请(专利权)人: | 深圳开源互联网安全技术有限公司 |
主分类号: | G06F8/41 | 分类号: | G06F8/41 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 廖厚琪 |
地址: | 518100 广东省深圳市龙华区民治*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 泄露 代码 检索 方法 装置 计算机 可读 存储 介质 | ||
本申请涉及一种泄露代码检索处理方法、装置及计算机可读存储介质。所述方法包括:当接收到对应于泄露代码关键词的检索指令时,爬取对应于泄露代码关键词的项目信息;根据检索请求类型,构建对应于检索请求类型的检索语句;将检索语句在项目信息中进行检索,得到对应于检索语句的检索结果;通过本申请方案的实施,根据检索请求类型构建检索语句,并在对应于泄露代码关键词的项目信息进行检索,从检索结果中获到泄露代码的位置信息,从而有效地提高泄露代码检索的效率。
技术领域
本申请涉及信息安全技术领域,尤其涉及一种泄露代码检索方法、装置及计算机可读存储介质。
背景技术
目前在监测和检测泄露代码时,如在对GitHub平台上的泄露代码进行检测时,现有的相关技术通常采用调用GitHub平台的API接口的方式,通过接口的检索功能实现与关键词相关的开源项目和项目代码的检索。
这种方式会受到GitHub平台API接口的限制和影响,例如在搜索代码时,GitHub的API接口频率限制很大(认证后只有30次/分钟),无法满足快速搜索;在实际搜索时,某些项目关键词的搜索结果项可能会超过100条,而API在设置per_page参数后至多支持展现100条结果项,无法完全展示搜索结果;并且由于接口功能的限制,只能检测接口提供的与关键词相关项目信息,无法提供关键词所在项目的上下文代码片段;无法进行并行检索,从而大大降低了关键词检索的效率。
发明内容
本申请实施例提供了一种泄露代码检索方法、装置及计算机可读存储介质,至少能够解决相关技术在通过关键词进行泄露代码检索时效率较低且不能并行检索的问题。
本申请实施例第一方面提供了一种泄露代码检索方法,包括:
当接收到对应于泄露代码关键词的检索指令时,爬取对应于所述泄露代码关键词的项目信息;
根据检索请求类型,构建对应于所述检索请求类型的检索语句;其中,所述检索请求类型包括:敏感路径检索请求、敏感代码关键词检索请求、敏感文件名检索请求;
将所述检索语句在所述项目信息中进行检索,得到对应于所述检索语句的检索结果;其中,所述检索结果为对应于所述泄露代码关键词的位置信息。
本申请实施例第二方面提供了一种泄露代码检索装置,包括:
爬取模块,用于当接收到泄露代码关键词的检索指令时,爬取对应于所述泄露代码关键词的项目信息;
构建模块,用于根据检索请求类型,构建对应于所述检索请求类型的检索语句;其中,所述检索请求类型包括:敏感路径检索请求、敏感代码关键词检索请求、敏感文件名检索请求;
检索模块,用于将所述检索语句在所述项目信息中进行检索,获得对应于所述检索语句的检索结果;其中,所述检索结果为对应于所述泄露代码关键词的位置信息。
本申请实施例第三方面提供了一种电子装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述本申请实施例第一方面提供的泄露代码检索方法中的各步骤。
本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述本申请实施例第一方面提供的泄露代码检索方法中的各步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳开源互联网安全技术有限公司,未经深圳开源互联网安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211296187.5/2.html,转载请声明来源钻瓜专利网。