[发明专利]AST处理方法、神经网络模型训练方法、装置和存储介质在审
申请号: | 202110784564.9 | 申请日: | 2021-07-12 |
公开(公告)号: | CN115618929A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 赵明;邓晶晶;邓琛 | 申请(专利权)人: | 苏州洞察云信息技术有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/047;G06N3/09 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;张颖玲 |
地址: | 215101 江苏省苏州市吴中区木*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ast 处理 方法 神经网络 模型 训练 装置 存储 介质 | ||
本发明公开了一种AST处理方法、神经网络模型训练方法、装置和存储介质,其中,AST处理方法包括:获取待处理的抽象语法树AST;将AST输入到训练好的神经网络模型中,通过神经网络模型中基于树结构的嵌入层对AST的所有节点进行嵌入编码,得到嵌入编码后的AST;通过神经网络模型中的编码器对嵌入编码后的AST进行处理,得到编码器处理后的AST,编码器是基于双向神经网络构建得到的,使得编码器处理后的AST的同级节点的路径不相同,整个流程能够维持原树形结构的结构化信息,从而减少了原始信息的损失;通过神经网络模型中的解码器对编码器处理后的AST进行处理,预测得到目标AST,由此实现了AST与目标AST之间的端到端的转换。
技术领域
本发明涉及计算机技术领域,尤其涉及一种AST处理方法、神经网络模型训练方法、装置和存储介质。
背景技术
抽象语法树(Abstract Syntax Tree,AST)是一种可用于神经网络分析的语言的中间表示。AST为一种树形结构,反映了节点类型以及节点之间的关联关系。
相关技术中,在对诸如程序语言、自然语言等语言处理时,通常会将原始语言的AST转换成节点序列,再将节点序列输入到神经网络模型进行处理。
然而,由于输入到神经网络模型的节点序列并不具有原树形结构的结构化信息,因此使得原始信息损失较大,从而使得语言处理的准确性较低。
发明内容
有鉴于此,本发明的主要目的在于提供一种AST处理方法、神经网络模型训练方法、装置和存储介质。
本发明的技术方案是这样实现的:
第一方面,提供了一种AST处理方法,所述方法包括:
获取待处理的抽象语法树AST;
将所述AST输入到训练好的神经网络模型中,通过所述神经网络模型中基于树结构的嵌入层对所述AST的所有节点进行嵌入编码,得到嵌入编码后的所述AST;
通过所述神经网络模型中的编码器对嵌入编码后的所述AST进行处理,得到所述编码器处理后的AST,其中,所述编码器是基于双向神经网络构建得到的;
通过所述神经网络模型中的解码器对所述编码器处理后的AST进行处理,预测得到目标AST。
第二方面,提供了一种神经网络模型训练方法,所述方法包括:
获取训练样本,所述训练样本包括样本AST以及样本目标AST;
将所述训练样本输入到预设的神经网络模型中,通过所述神经网络模型中基于树结构的嵌入层分别对所述样本AST的所有节点以及所述样本目标AST的所有节点进行嵌入编码;
通过所述神经网络模型中的编码器对嵌入编码后的所述样本AST进行处理,得到所述编码器处理后的样本AST,其中,所述编码器是基于双向神经网络构建得到的;
通过所述神经网络模型中的解码器对所述编码器处理后的样本AST进行处理,预测目标AST的节点;
基于所述解码器预测的所述目标AST的节点以及嵌入编码后的所述样本目标AST,采用强迫指导的训练模式对所述神经网络模型进行训练。
第三方面,提供了一种AST处理装置,所述装置包括:
获取模块,用于获取待处理的抽象语法树AST;
嵌入模块,用于将所述AST输入到训练好的神经网络模型中,通过所述神经网络模型中基于树结构的嵌入层对所述AST的所有节点进行嵌入编码,得到嵌入编码后的所述AST;
编码模块,用于通过所述神经网络模型中的编码器对嵌入编码后的所述AST进行处理,得到所述编码器处理后的AST,其中,所述编码器是基于双向神经网络构建得到的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州洞察云信息技术有限公司,未经苏州洞察云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110784564.9/2.html,转载请声明来源钻瓜专利网。