[发明专利]AST处理方法、神经网络模型训练方法、装置和存储介质在审
申请号: | 202110784564.9 | 申请日: | 2021-07-12 |
公开(公告)号: | CN115618929A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 赵明;邓晶晶;邓琛 | 申请(专利权)人: | 苏州洞察云信息技术有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/047;G06N3/09 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;张颖玲 |
地址: | 215101 江苏省苏州市吴中区木*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ast 处理 方法 神经网络 模型 训练 装置 存储 介质 | ||
1.一种AST处理方法,其特征在于,所述方法包括:
获取待处理的抽象语法树AST;
将所述AST输入到训练好的神经网络模型中,通过所述神经网络模型中基于树结构的嵌入层对所述AST的所有节点进行嵌入编码,得到嵌入编码后的所述AST;
通过所述神经网络模型中的编码器对嵌入编码后的所述AST进行处理,得到所述编码器处理后的AST,其中,所述编码器是基于双向神经网络构建得到的;
通过所述神经网络模型中的解码器对所述编码器处理后的AST进行处理,预测得到目标AST。
2.根据权利要求1所述的方法,其特征在于,所述通过所述神经网络模型中基于树结构的嵌入层对所述AST的所有节点进行嵌入编码,得到嵌入编码后的所述AST,包括:
当所述AST的节点的节点名称不是词典溢出词OOV时,根据所述AST的节点的ID值获取所述AST的节点的嵌入编码;
当所述AST的节点的节点名称是词典溢出词OOV时,从所述嵌入层的权重矩阵同分布的自然分布中获取所述AST的节点的嵌入编码。
3.根据权利要求1或2所述的方法,其特征在于,所述通过所述神经网络模型中的编码器对嵌入编码后的所述AST进行处理,得到所述编码器处理后的AST,包括:
通过所述编码器对嵌入编码后的所述AST自底向上进行叶子节点到根节点的信息传递;
通过所述编码器对自底向上信息传递完成后的所述AST自顶向下进行根节点到叶子节点的信息传递,得到所述编码器处理后的AST。
4.根据权利要求3所述的方法,其特征在于,所述通过所述编码器对嵌入编码后的所述AST自底向上进行叶子节点到根节点的信息传递,包括:
通过所述编码器遍历嵌入编码后的所述AST的每个节点,将当前遍历到的节点作为当前根节点;
根据所述当前根节点的左子节点和右子节点各自的隐藏状态以及所述当前根节点的嵌入编码,更新所述当前根节点的隐藏状态,直至将嵌入编码后的所述AST的特征信息汇集到整棵树的根节点时,结束遍历。
5.根据权利要求3所述的方法,其特征在于,所述通过所述编码器对自底向上信息传递完成后的所述AST自顶向下进行根节点到叶子节点的信息传递,得到所述编码器处理后的AST,包括:
通过所述编码器遍历自底向上信息传递完成后的所述AST的每个节点,将当前遍历到的节点作为当前根节点;
根据所述当前根节点的父节点的隐藏状态、所述当前根节点的兄弟节点的隐藏状态以及所述当前根节点的嵌入编码,更新所述当前根节点的隐藏状态,直至遍历结束,得到所述编码器处理后的AST;
其中,所述当前根节点的兄弟节点与所述当前根节点具有同一个父节点。
6.根据权利要求1或2所述的方法,其特征在于,所述编码器为根据深度双向的基于树结构的长短期记忆神经网络构建得到。
7.根据权利要求3所述的方法,其特征在于,所述通过所述神经网络模型中的解码器对所述编码器处理后的AST进行处理,预测得到目标AST,包括:
基于所述编码器处理后的AST,通过所述解码器使用自回归的解码方式预测复制或预测生成所述目标AST的每个节点的左子节点和右子节点,得到所述目标AST。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州洞察云信息技术有限公司,未经苏州洞察云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110784564.9/1.html,转载请声明来源钻瓜专利网。