[发明专利]代码克隆检测方法、装置、设备、存储介质及程序产品在审

专利信息
申请号: 202210784064.X 申请日: 2022-06-28
公开(公告)号: CN115309451A 公开(公告)日: 2022-11-08
发明(设计)人: 吴锋;李文科;杨永强;吴佳骏;周凡 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F8/75 分类号: G06F8/75;G06F8/41;G06K9/62
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 祝亚男
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请实施例公开了一种代码克隆检测方法、装置、设备、存储介质及程序产品,属于计算机技术领域。该方法包括:获取代码源文件的语法信息以及语义信息;对语法信息以及语义信息进行信息融合,得到代码融合信息;对代码融合信息进行特征提取,得到代码源文件的特征向量;基于各个代码源文件的特征向量进行特征对比,得到克隆检测结果。基于对源代码的语法分析和语义分析结果进行克隆检测,既能够有效甄别微小的语法变化对相似度的影响,也能够有效识别出同质异构的代码片段,有助于提高各种类型的克隆代码的检测准确率。
搜索关键词: 代码 克隆 检测 方法 装置 设备 存储 介质 程序 产品
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210784064.X/,转载请声明来源钻瓜专利网。

同类专利
  • 应用程序识别方法、装置、电子设备及可读存储介质-202310936027.0
  • 刘通;李佳隆;王德南 - 重庆赛力斯新能源汽车设计院有限公司
  • 2023-07-27 - 2023-10-27 - G06F8/75
  • 本申请涉及智能座舱技术领域,提供了一种应用程序识别方法、装置、电子设备及可读存储介质。该方法包括:确定车载系统的各应用程序的安装包中是否存在系统签名;若安装包中不存在系统签名,确定对应的应用程序的类别为第三方应用程序;若安装包中存在系统签名,基于预设解析方式解析安装包,得到解析结果;若解析结果存在指定标签,确定对应的应用程序的类别为指定应用程序,指定标签为指定应用程序基于开发情况存入的标签;若解析结果不存在指定标签,确定对应的应用程序的类别为第三方应用程序。本申请提供的应用程序识别方法,能够根据解析结果区分应用程序的来源,提升车载系统性能,提升使用车载系统的使用体验。
  • 一种A2L文件快速解析与生成装置及方法-202310941125.3
  • 张宇;黄都;李永聪;赵瑞腾;徐辉;钟秋;吕智愚 - 重庆红江机械有限责任公司
  • 2023-07-28 - 2023-10-27 - G06F8/75
  • 本发明涉及一种A2L文件快速解析与生成装置及方法,属于文件解析领域。根据A2L文件遵循的ASAM MCD‑2MC(ASAP2)标准特征,本发明采用逐词检查、动态生成、结构映射的方式快速、稳定地解析A2L文件,将A2L文件内容解析为节点块元素和属性项元素两类主要元素,其中节点块元素支持树形结构生长。A2L文件的内容结构被解析为节点块元素和属性项元素(作为叶子节点)的结构树,各元素的内容配置被解析为A2L元素参数表。同时,对解析的结构树和节点内容进行正向遍历并输出,可以快速实现A2L文件的生成。由于A2L文件结构和内容的完全解析和参数化,本发明可以支持灵活访问和修改文件内容、扩展外部接口。
  • 识别和表征代码变更的系统-202211615538.4
  • S.拉瓦尼亚 - SAP欧洲公司
  • 2022-12-15 - 2023-10-20 - G06F8/75
  • 系统和方法包括确定第一代码工件和第二代码工件,基于第一代码工件生成第一多个键‑值对并基于第二代码工件生成第二多个键‑值对,识别第一多个键‑值对和第二多个键‑值对之间的多个变更,该多个变更由第三多个键‑值对表示;对于多个规则中的每一个,确定第三多个键‑值对是否包括与规则关联的至少一个键‑值对,并且如果是,则将规则应用于至少一个键‑值对中的每一个,以确定与至少一个键‑值对中的每一个关联的分析输出,并基于分析输出生成可视化。
  • 数据流程处理方法、装置、设备、介质和程序产品-202310658557.3
  • 李亚雄 - 中国银行股份有限公司
  • 2023-06-05 - 2023-10-17 - G06F8/75
  • 本申请涉及一种数据流程处理方法、装置、设备、介质和程序产品,涉及大数据技术领域。该方法包括:响应于流程查询指令,获取流程查询指令对应的目标功能模块;从关系存储表中获取目标功能模块中的数据流程关系;关系存储表中存储有软件系统中多个功能模块的数据流程关系;展示目标功能模块中的数据流程关系。其中,目标功能模块为软件系统中的任一功能模块。采用本方法能够快速获取计算机系统完整的数据流程,进而加快软件系统的更新进度。
  • 一种代码审查方法、装置、终端设备及存储介质-202310795247.6
  • 何湛彬 - 深圳派氪司科技有限公司
  • 2023-06-30 - 2023-10-13 - G06F8/75
  • 本申请适用于计算机技术领域,提供了一种代码审查方法、装置、终端设备及存储介质,所述方法包括:获取待审查代码;根据待审查代码和设定的审查策略,生成待审查代码对应的审查提示语;审查提示语用于表征待审查代码的审查目的;根据审查提示语,对待审查代码进行代码审查处理,得到待审查代码的审查结果。与现有技术直接将待审查代码输入至现有的代码审查工具进行处理相比,本申请的方法需要结合待审查代码和设定审查策略,生成待审查代码对应的审查提示语,之后再根据该审查提示语对待审查代码进行针对性的审查,从而提高了代码审查的准确率。
  • 应用页面解析方法、装置、电子设备与计算机可读介质-202311133555.9
  • 李祉岐;马丛淦;孙磊;尹琴;郭晨萌;李宁 - 国网思极网安科技(北京)有限公司;国网信息通信产业集团有限公司
  • 2023-09-05 - 2023-10-13 - G06F8/75
  • 本公开的实施例公开了应用页面解析方法、装置、电子设备与计算机可读介质。该方法的一具体实施方式包括:构建目标应用对应站点的站点标识;将站点关联的各个应用页面包含的应用页面资源定位标识录入至站点中;对于各个应用页面中的每个应用页面,根据应用页面录入至站点的各个应用页面资源定位标识,生成应用页面标识,其中,各个应用页面中的应用页面包含至少一个应用页面资源定位标识;对于每个应用页面标识,根据应用页面标识与对应的应用页面资源定位标识,生成应用页面资源定位标识关系表;根据站点标识与各个应用页面资源定位标识关系表,生成应用页面解析文件。该实施方式提升了埋点数据采集的效率,减少了计算量,缩短了页面解析时间。
  • 一种代码作者归属确定方法、装置、设备及介质-202310826032.6
  • 付才;韩兰胜;江帅;郭晓威;李文科;李柯;洪胜;刘铭;邹德清 - 华中科技大学
  • 2023-07-07 - 2023-10-03 - G06F8/75
  • 本发明公开了一种代码作者归属确定方法、装置、设备及介质,先确定训练样本以及标注的代码作者,然后对代码的风格属性进行划分,确定训练样本对应每种风格属性的归属统计信息,接着将各归属统计信息分别输入不同特征提取分类器,根据标注作者对各特征提取分类器进行训练,以及将特征提取分类器的特征提取层提取到的归属特征进行拼接并输入综合分类器,根据标注作者对综合分类器进行训练,最后获取待确定作者归属的未知代码,通过训练后的特征提取分类器和综合分类器,确定代码作者归属。通过对代码的风格属性进行划分,采用多个特征提取分类器进行特征提取,避免了特征忽略,提高了综合分类器的特征利用,从而提高了代码作者归属确定的准确率。
  • 一种基于数据挖掘的软件成分分析系统-202310621243.6
  • 温胤鑫;黄永军;谢耘 - 北京东方通网信科技有限公司
  • 2023-05-29 - 2023-10-03 - G06F8/75
  • 本申请提供一种基于数据挖掘的软件成分分析系统,包括:静态构件分析模块,对软件组成进行静态分析检测,通过提取软件中包含的信息与特征,得到软件的组件分布信息;漏洞扫描模块,基于预设开源漏洞数据库,对所述软件的组件分布信息进行漏洞扫描和匹配;开源代码许可证分析模块,用于检测分析软件中的开源代码许可证,以获取所述软件的许可证信息;快速部署模块,基于虚拟化部署、分布式部署、镜像部署,通过多个API接口与外部系统进行无缝衔接。本申请识别高效、准确:扫描速度快、效率高。支持代码组件、代码文件、代码片段级别的扫描和匹配,保障识别精准;覆盖范围广泛,能够同时进行软件成分构成、分析开源代码许可证、安全漏洞等分析。
  • 一种应用仿冒检测方法、智能终端及存储介质-201910972286.2
  • 廖志山 - 北京智游网安科技有限公司
  • 2019-10-14 - 2023-10-03 - G06F8/75
  • 本发明公开了一种应用仿冒检测方法、智能终端及存储介质,在判断应用是否为仿冒应用时,获取应用的基本信息和界面文字信息、获取所述应用的图标以及获取所述应用的代码,当每个所述应用经过基本信息仿冒检测、图标仿冒检测以及代码仿冒检测后,任意一个检测满足条件的所述应用判定为仿冒的APK应用;本发明通过应用基本信息相似性检测、应用图标相似性检测以及应用代码仿冒检测,对疑似仿冒应用和被仿冒应用进行信息对比,分析出三个方面两个应用的相似度,可以全面综合检测出仿冒应用,有效识别安全风险,降低仿冒应用的危害。
  • 一种新型可编程的服务编排方法-202310794741.0
  • 胡卫兵;兰清;刘树权;庞海东 - 南京星邺汇捷网络科技有限公司
  • 2023-06-29 - 2023-09-29 - G06F8/75
  • 本发明公开了一种新型可编程的服务编排方法,包括第一步,确认开始节点,第二步,识别API逻辑所需的一个或多个输入信息,且输入信息由串行外设接口SPI服务输出处理结果,第三步,创建全局缓存,第四步,建立数据库,第五步,创建自定义编程PYTHON节点和第六步,确认结束节点。本发明创建了全局缓存并建立了数据库,这样任何一个服务节点处理的结果可以存放在全局缓存,同时其他任何服务节点可以引用全局缓存的结果进行业务处理,同时创建自定义编程PYTHON节点,可以自定义插入更多的业务逻辑,且PYTHON节点可以引用和调取API节点、全局缓存和数据库内的数据,并能够将数据写入全局缓存和数据库内。
  • 一种操作系统代码漏洞检测方法、装置、设备及介质-202310716321.0
  • 朱春欢;卢延云;郭昶;李振锋 - 中国科学院微电子研究所
  • 2023-06-15 - 2023-09-29 - G06F8/75
  • 本公开提供了一种操作系统漏洞检测方法、装置、设备及介质,该方法包括获取待检测的操作系统源码文件;以函数为粒度进行切分,生成函数级的代码属性图;将代码属性图进行矩阵化与节点的向量化,获得代码属性图的邻接矩阵和特征矩阵;将所述邻接矩阵和特征矩阵输入至训练好的代码漏洞检测模型,获得代码漏洞检测结果;其中,所述代码漏洞检测模型为通过带漏洞标记的数据完成训练的神经网络模型。本发明中代码属性图是代码语义层面的表征,能够准确描述程序的语义和语法信息,GGNN模型对输入的特征矩阵与邻接矩阵数据进行训练实现漏洞的分类,图神经网络能够捕获图中节点与边的相关性,能够总结最优的分类模型,可以运用于大规模漏洞检测。
  • 程序语言的统一形式语义化方法-202310825407.7
  • 张霄;黄虹银;邓科;罗懋康;梁倩云 - 四川大学
  • 2023-07-06 - 2023-09-29 - G06F8/75
  • 本发明涉及程序语言的统一形式语义化方法,属于电数字数据处理技术领域,包括程序形式语义化的一般化数学方法、形式表达语义运算的构建方法、抽象机的形式语义运算方法、基于形式语义模块生成过程思维类型规范化、结构化、形式化方法。使得程序语言的统一形式语义化方法不受制于程序语言的主观行为影响,不受制于不同编程语言的语法影响,可以提炼出程序的特征,且保留程序的所有功能,使得非智能技术专业的专家也可以对这段代码进行理解和分析,进而在相应领域下进行判断或决策。
  • 数据转换方法、电子设备及计算机可读存储介质-202310651117.5
  • 赵黎光;黎国本;梁德英 - 超聚变数字技术有限公司
  • 2023-06-02 - 2023-09-26 - G06F8/75
  • 本申请实施例公开一种数据转换方法、电子设备及计算机可读存储介质,该方法包括:基于第一Typescript代码文件中的声明,以及JSDoc标签和/或注解,生成第一Typescript代码文件对应的UML类图;其中,JSDoc标签和/或注解用于标识Typescript代码文件中类与类之间、类与接口之间、接口与接口之间的关系。本申请实施例,可以基于代码文件中的声明,以及JSDoc标签和/或注解,自动生成代码文件对应的UML类图,可以提高UML类图绘制效率。
  • 基于大型预训练模型AI链的控制流图生成方法及系统-202310702648.2
  • 黄箐;邹舟;左正康;邢振昌;曾锦山;王昌晶 - 江西师范大学
  • 2023-06-14 - 2023-09-22 - G06F8/75
  • 本发明涉及人工智能领域,提供一种基于大型预训练模型AI链的控制流图生成方法及系统,对Java代码进行结构层次提取,结构层次提取是指提取所述Java代码的嵌套级别;提取每一层嵌套结构中的嵌套代码块,基于所述提取出来的嵌套级别,得到所述每一层嵌套级别对应的代码块;生成所述嵌套代码块的控制流图;将嵌套代码块的控制流图融合在一起,形成最后的整个Java代码的控制流图。本发明通过利用LLM的上下文学习能力来克服传统静态分析方法在生成Java代码的控制流图的挑战;LLM可以容忍包含显示语法错误的代码并检测隐性语义错误;防止生成的控制流图出现行为偏差,提高生成控制流图准确性。
  • 基于AI Chain的隐性数据流感知DFG生成方法、系统及存储介质-202310702650.X
  • 黄箐;罗智文;曾锦山;邢振昌;王昌晶;左正康 - 江西师范大学
  • 2023-06-14 - 2023-09-22 - G06F8/75
  • 本发明涉及数据程序分析领域,提供一种基于AI Chain的隐性数据流感知DFG生成方法、系统及存储介质,包括模拟人从程序中提取DFG的过程,将DFG生成任务分解为多个子任务,每个子任务交由一个单独的大型语言模型来完成;基于大型语言模型的上下文学习能力,针对每个子任务,构建prompt,形成一个个AI模块;将prompt以串联或者并联的方式组装形成一条AI Chain,进而生成DFG。本发明利用大型语言模型的语言理解和模式匹配能力,捕捉变量的def‑use流信息,并预测运行时发生的隐性数据流,通过大型语言模型的上下文学习能力,能够实现对程序中的隐性数据流的精准捕获;增强了生成DFG的鲁棒性和可控性。
  • 一种函数调用路径获取的方法和相关装置-201810800298.2
  • 周志刚 - 深圳市大梦龙途网络科技有限公司
  • 2018-07-20 - 2023-09-22 - G06F8/75
  • 本发明实施例公开了一种函数调用路径获取的方法和相关装置。本发明实施例方法包括:调用API中的EnumProcessModule函数获取当前进程中加载的所有模块的模块信息,所述模块信息包括内存起始地址、内存结束地址和模块的标识信息;通过标准模板库STL中的链表listModuleInfo存储所述所有模块的模块信息;获取核心函数的调用链路,所述调用链路与所述核心函数的内存地址对应;将所述核心函数的调用链路包含于try_except函数中以进行读取操作;当所述读取操作正常执行时,确定获取到的所述核心函数的调用链路是否存在于链路存储集合中;当所述核心函数的调用链路不存在于所述链路存储集合中时,通过所述STL中的数组VectorDWORD将所述核心函数的调用链路保存在所述链路存储集合中。
  • 一种基于组合模式的ICD头文件生成方法-202310382386.6
  • 程新满;葛晨;洪斌;魏石峰;仇翔东 - 中国直升机设计研究所
  • 2023-04-11 - 2023-09-15 - G06F8/75
  • 本发明属于计算机软件领域,具体涉及一种基于组合模式的ICD头文件生成方法,包括以下步骤:步骤1:导出ICD文件;步骤2:初始化根节点对象rootComppsite;步骤3:解析数据块,完成所有数据块遍历;步骤4:ICD头文件代码生成,本发明针对ICD从数据库信息转换为C代码头文件的过程,提出了一种基于组合模式的ICD头文件生成方法,利用该方法体现“部分-整体”的层次结构,使得代码生成过程中对单个对象和组合对象的使用具有一致性,能够满足不同数据总线的适配需求,代码生成过程中调用逻辑和接口高度统一,生成工具的代码具备较好的可维护性,相比人工编码极大地提高了工作效率,并保证代码质量。
  • 功能点变更范围的确定方法、装置、电子设备及存储介质-202310714544.3
  • 孙华强 - 中银金融科技有限公司
  • 2023-06-15 - 2023-09-12 - G06F8/75
  • 本申请公开了一种功能点变更范围的确定方法、装置、电子设备及存储介质,可应用于大数据领域或金融领域。获取Web页面信息及其包含的应用接口信息,基于Web页面信息得到对应的目标DOM树,基于目标DOM树、Web页面信息、应用接口信息生成目标数据血缘图谱,根据应用系统的功能点变更时涉及的目标Web页面信息、目标应用接口信息和DOM元素,从目标数据血缘图谱中确定功能点变更范围。本发明中目标数据血缘图谱可以覆盖应用系统全链路数据之间的关联关系,从而可以基于功能点变更时涉及的目标Web页面信息、目标应用接口信息和DOM元素确定功能点变更范围,进而确定应用系统变更范围,保障应用系统的稳定运行。
  • 一种基于区块链的高速可并行代码相似度对比方法和系统-202111047253.0
  • 蔡维德 - 北京天德科技有限公司;天民(青岛)国际沙盒研究院有限公司
  • 2021-09-08 - 2023-09-12 - G06F8/75
  • 本发明提供一种基于区块链的高速可并行代码相似度对比方法,包括:步骤1,将需要进行代码相似度对比的系统进行分类;步骤2,将需要进行代码相似度对比的系统内部的源代码文件进行分类;步骤3,将源代码文件进行逐行分类;步骤4,将每一行代码按照不同规则的切分,按照不同规则的切分包括按照标点、单词或空格进行切分;步骤5,提取各个code代码段的特征;步骤6,以系统为单位,对比各个code代码段的特征,当特征相同的时候,则认为code代码段相同;步骤7,根据相同的code代码段的数量获得代码相似度的度量。还提供一种基于区块链的高速可并行代码相似度对比系统。
  • 一种基于可微随机游走核和神经网络的二进制代码相似性检测方法-202211250080.7
  • 程戈;胡君钦 - 湘潭大学
  • 2022-10-12 - 2023-09-05 - G06F8/75
  • 本发明提出了一种基于可微随机游走核和神经网络的二进制代码相似性检测方法及系统。本发明方法包括获取待检测二进制代码对,将待检测二进制代码对进行反编译,获得其控制流程图;利用核函数提取待检测二进制代码流程图的结构特征;通过神经网络对待检测二进制代码的控制流程图的结构特征进行编码,并得到对应的结构嵌入利用二进制代码对的控制流程图的结构信息嵌入的相似性作为待检测二进制代码的相似性结果。本发明通过图核和神经网络结合的方法来提取二进制代码控制流程图的结构信息,能够很好的捕捉到隐藏在二进制代码中的控制依赖,从而有效地提升检测的精确率和效率,在二进制程序安全中有着非常重要的作用。
  • 一种基于源代码水印的同源性检测方法及系统-202310667105.1
  • 谢朝海;齐大伟;李志勇;谢朝战 - 深圳海云安网络安全技术有限公司
  • 2023-06-07 - 2023-08-29 - G06F8/75
  • 本发明涉及一种基于源代码水印的同源性检测方法及系统,通过预处理源代码,转换为抽象语法树,提取语法结构和语义特征;采用插件式架构,适应不同编程语言和框架,提取水印特征;对比源代码的语法、语义和水印特征相似度,设定阈值,判断是否具有同源性,避免误判;如有同源性,核验非混淆性质水印特征,如特定字符串、代码片段或算法实现。本发明具有快速、准确、灵活和稳定等有益效果,能够有效地应用于软件版权保护、代码安全审计等领域,对保护软件版权和保障信息安全具有重要意义。
  • 一种Web前端代码依赖关系可视化方法-201911137711.2
  • 周圆;张岳;金明磊;赵恩伟;邓守峰 - 天津大学
  • 2019-11-19 - 2023-08-29 - G06F8/75
  • 本发明公开了一种Web前端代码依赖关系可视化方法,该方法利用分析项目代码得到包含代码信息及引用关系的原始数据,对其增强得到强化数据,再将强化数据映射到可视化模型上,最后使用ECharts进行渲染得到代码依赖关系的可视化图形,可视化图形可支持人机交互,可通过筛选原始数据,重新得到新渲染的可视化图形。与现有技术相比,原本需要人工检查才能分析得到的依赖关系,本发明提出的一种Web前端代码依赖关系可视化方法可以自动化地分析并渲染成可视化的图形,有助于减少不必要的依赖,优化代码结构。
  • 程序代码的比对方法、比对装置-202010393234.2
  • 游辉敏;顾继光 - 南京域智智能科技有限公司
  • 2020-05-11 - 2023-08-29 - G06F8/75
  • 本发明公开了一种程序代码的比对方法、比对装置,其中,比对方法包括:定义程序代码键的组成;扫描标准程序代码,形成由键组成的标准程序代码的树型结构;根据键的组成,提取标准程序代码中涉及键的代码段,以获取标注的代码段,并根据标注的代码段确定标准程序代码的值的组成;根据标准程序代码的树型结构和值的组成,形成标准程序代码的键‑值树型结构;根据标注的代码段,将标准程序代码的键‑值树型结构进行剪枝,形成特征代码;扫描新程序代码,将新程序代码与所述特征代码进行比对。由此,该方法可以对程序代码进行分层、分段解析,并形成具有特征的特征代码,大大提升了相似代码的匹配效率,以便于程序批改时对代码进行比对。
  • 基于自然语言处理的分布式程序切片方法、装置及设备-202310047166.8
  • 王桐;陈业斌;李雪 - 安徽工业大学
  • 2023-01-31 - 2023-08-25 - G06F8/75
  • 本发明涉及程序分析领域,提供一种基于自然语言处理的分布式程序切片方法、装置、设备和存储介质,包括如下步骤:利用自然语言处理技术提取及分析程序源代码所使用的分布式通信包中的具有通信功能的接口,并依据接口功能对其分类;基于所述程序源代码构造程序依赖图;基于所述通信接口和所述程序依赖图构造分布式程序依赖图;基于所述分布式程序依赖图计算分布式程序切片。本发明利用自然语言处理技术自动提取和识别通信接口并构造分布式程序依赖图,从而达到高效且精准计算分布式切片的效果。
  • 一种智能合约字节码相似性检测方法-202310593717.0
  • 秦中元;左辉;陈玉清;张群芳;杨继斌 - 东南大学
  • 2023-05-24 - 2023-08-22 - G06F8/75
  • 本发明公开一种智能合约字节码相似性检测方法,包括:字节码数据预处理;通过数据增强实现训练数据集构造;自监督学习网络构建;自监督学习的训练;使用训练得到的模型生成表征向量,完成相似度计算。本发明基于自监督学习方法,能够对输入的字节码在函数级别进行表征学习,利用学习到的表征向量实现智能合约字节码的相似性计算。本发明结合Transformer和CNN模型,共同完成字节码特征提取,实现捕获更多语义,在缺乏带有相似性标签的数据集的前提下,自监督学习方法在现有数据集上以完成辅助任务的方式实现表征学习,免去了人工构造带有相似性标签的训练数据集的复杂过程。
  • 信息的提取方法和装置、处理器及电子设备-202310653832.2
  • 丁凯文 - 中国工商银行股份有限公司
  • 2023-06-02 - 2023-08-18 - G06F8/75
  • 本申请公开了一种信息的提取方法和装置、处理器及电子设备。涉及人工智能领域,该方法包括:对模型源代码进行层次划分,并根据划分后的模型源代码和模型源代码的数据流向生成模型源代码的有向无环图;遍历有向无环图中的每一个节点,对每一个节点包含的模型源代码进行代码解析,并根据解析结果生成模型源代码的抽象语法树;对抽象语法树中的节点按照预设规则进行聚合处理,并根据聚合结果确定出模型源代码的关键特征信息,其中,关键特征信息用于确定模型源代码对应的模型的类别;通过本申请,解决了相关技术中现有的模型特征分析方法会忽略特征之间的复杂关系,导致进行模型特征分析时,会消耗大量的时间和人力资源,用户体验差的问题。
  • 一种分析型数据口径管理方法、系统、设备及存储介质-202211526173.8
  • 罗明明;温海林;黄凯;付渤钧;王立 - 广发银行股份有限公司
  • 2022-11-29 - 2023-08-18 - G06F8/75
  • 本发明提供了一种分析型数据口径管理方法、系统、设备及存储介质,所述方法包括:获取数据分析加工代码,并根据预设的程序开发规约,从数据分析加工代码中提取数据处理逻辑脚本;对数据处理逻辑脚本进行语法解析,得到对应的数据口径加工脚本;对数据口径加工脚本进行关系解析,得到对应的字段口径信息;根据字段口径信息和预设的图论分析工具,构建口径关系网络图。本发明通过集“数据逻辑提取、脚本语法解析、数据关系网络图构建、动态数据口径监测与更新”为一体的自动化数据口径管理方法,实现数据口径的全局性直观存储展示及实时更新,有效解决现有数据口径在管理、设计、存储和表示等方面的应用缺陷,具有较高的应用价值。
  • 基于图片相似度的代码克隆检测方法、系统及存储介质-202310583348.7
  • 王宁;胡雨涛;索雯琪;吴月明;王可馨;邹德清 - 华中科技大学
  • 2023-05-23 - 2023-08-18 - G06F8/75
  • 本发明公开了一种基于图片相似度的代码克隆检测方法、系统及存储介质,属于源代码克隆检测领域,包括:S1、构建源代码集的倒排索引字典;S2、计算待测目标文件的代码块哈希值,并以每个代码块的哈希值为键在所述倒排索引字典中搜索,得到对应的源代码的文件名列表;S3、计算待测目标文件与所述列表中每个源代码的代码块相似度K,若,则判断待测目标文件与对应的源代码不存在克隆关系;若,则判断待测目标文件与对应的源代码存在克隆关系;S4、提取对应的源代码以及待测目标文件的语义特征矩阵,并分别转换为对应的图片,分别计算待测目标文件与每个所述源代码对应的图片相似度,得到检测结果。本发明兼顾了大规模和语义克隆检测。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top