[发明专利]一种基于神经网络语言模型的代码分类方法有效

申请号：	201710426179.0	申请日：	2017-06-08
公开（公告）号：	CN107220180B	公开（公告）日：	2020-08-04
发明（设计）人：	屈鸿;杨林川;涂强;张书州;王淼;颜志鹏;王一鸣	申请（专利权）人：	电子科技大学
主分类号：	G06F11/36	分类号：	G06F11/36;G06F16/35;G06N3/08
代理公司：	成都弘毅天承知识产权代理有限公司 51230	代理人：	徐金琼;刘东
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	属于软件工程领域，公开了一种基于神经网络语言模型的代码分类方法，首先将代码转换为AST树，初始化AST树的结点ci的向量，利用孩子结点tx的向量得到非叶子结点pk的重构向量；利用AST_Node2Vec模型对所述结点ci的向量进行更新，若不满足循环条件，则继续循环；若满足循环条件，则输出更新了结点向量的AST树和更新后的非叶子结点的重构向量；将更新了结点向量的AST树和更新后的非叶子结点的重构向量作为基于树的卷积神经网络的输入，利用所述基于树的卷积神经网络完成对代码的分类；采用该方法对代码进行分类可有效的避免维度灾难问题，同时能够显示出语义上的相似性，能够很好的对代码按照功能进行分类。
搜索关键词：	一种基于神经网络语言模型代码分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于神经网络语言模型的代码分类方法，其特征在于：包括以下步骤：步骤1：将代码转换为AST树；步骤2：初始化AST树结点ci的向量vec(ci)，所述结点ci中非叶子结点pk的向量为vec(pk)1，所述非叶子结点pk的孩子结点tx的向量为vec(tx)，其中vec(pk)1∈vec(ci)，vec(tx)∈vec(ci)，其中i表示结点的序号，k表示非叶子节点的序号，x表示孩子结点的序号；步骤3：利用所述孩子结点tx的向量vec(tx)，得到所述非叶子结点pk的重构向量vec(pk)2；步骤4：利用AST_Node2Vec模型对所述结点向量vec(ci)进行学习，若不满足循环条件，则更新结点向量vec(ci)，跳转到步骤3；若满足循环条件，则输出更新了结点向量vec(ci)的AST树和更新后的非叶子结点pk的重构向量vec(pk)2；步骤5：将更新了结点向量vec(ci)的AST树和更新后的非叶子结点pk的重构向量vec(pk)2作为基于树的卷积神经网络的输入，利用基于树的卷积神经网络完成对代码的分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710426179.0/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F11-00 错误检测；错误校正；监控
G06F11-07 .响应错误的产生，例如，容错
G06F11-22 .在准备运算或者在空闲时间期间内，通过测试作故障硬件的检测或定位
G06F11-28 .借助于检验标准程序或通过处理作错误检测、错误校正或监控
G06F11-30 .监控
G06F11-36 .通过软件的测试或调试防止错误

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于神经网络语言模型的代码分类方法有效

专利文献下载