[发明专利]一种基于深度学习进行JavaScript类型推断的方法在审
申请号: | 201911020317.0 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110780878A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 孙建华;刘利娜;陈浩 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F8/41 | 分类号: | G06F8/41;G06F11/36;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及人工智能领域的深度学习,特别是涉及一种对源代码的学习。本发明的内容包括:数据的收集与处理、模型的构建、模型的训练、模型的评估、类型推断。数据的收集与处理包括:首先在Github上下载一定量的源代码,接着筛选类型丰富的源代码作为最终的数据集,然后将数据转换为单词(token)和类型(type)对齐匹配的格式,同时生成token和type词汇库,最后利用token‑type映射将源代码表示为一种适合学习的数据格式,如向量。模型的构建包括:首先确定神经网络种类,然后确定神经网络层数,最后确定每层神经元个数。模型的训练包括:跟踪损失函数值和分类误差,更新模型参数,直至得到准确度较高的模型。模型评估包括:统计模型的准确度和一致性。类型推断包括:加载训练好的准确度较高的模型,将类型推断结果标注在其对应标识符的后面,最后以文件的形式输出。其流程如图1所示。 | ||
搜索关键词: | 源代码 准确度 推断 神经网络 构建 标识符 神经元 人工智能领域 源代码表示 分类误差 结果标注 模型参数 模型评估 数据格式 数据转换 损失函数 统计模型 形式输出 对齐 词汇库 数据集 映射 加载 向量 学习 单词 匹配 筛选 跟踪 评估 更新 | ||
【主权项】:
1.一种采用深度学习技术进行JavaScript类型推断的方法,其步骤如下:/n(1)数据。包括数据的筛选、转换、切分、表示,最终作为模型的输入;/n(2)模型。包括神经网络组成、及其超参数的初始化等;/n(3)训练。跟踪模型的损失函数等,确定神经网络种类,网络层数、超参数等因素对模型精确度的影响,从而不断调整模型参数,进而不断提高模型准确度;/n(4)类型推断。将源代码文件作为模型的输入,加载训练好的模型中准确度较高的模型,针对输入中每一个标识符进行类型推断,并将推断的类型信息标注在其标识符的后面。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911020317.0/,转载请声明来源钻瓜专利网。