[发明专利]一种基于深度语义挖掘的代码段推荐方法在审
申请号: | 201810371788.5 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108717423A | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 陶传奇;包盼盼;黄志球;周宇;王铁鑫 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06F8/30;G06N3/08 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 贺翔 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度语义挖掘的代码段推荐方法,利用了深度学习技术在自然语言处理中的作用及其在自然语言语义挖掘中的优势,并且结合了有查询代码段推荐的特点。根据输入的自然语言搜索和代码段自身及其所带的注释,深度挖掘自然语言语义和代码段具体功能,生成句向量和段落向量,使得语义属性一致的代码段和自然语言查询因此被映射到相似的向量空间,为给定的查询推荐最匹配的、相似度由高到低排好序的N个代码段。本方法不仅提高了推荐的准确度,还能提高推荐的查全率,并对输入的自然语言查询查询具有较好的容错能力。 | ||
搜索关键词: | 代码段 自然语言查询 自然语言语义 挖掘 语义 向量 自然语言处理 自然语言搜索 查询代码 容错能力 向量空间 语义属性 准确度 查询 查全率 相似度 映射 匹配 学习 | ||
【主权项】:
1.一种基于深度语义挖掘的代码段推荐方法,其特征在于,包括如下步骤:步骤1):构造大规模的带方法描述信息的代码段集S;步骤2):构造方法描述信息集D1和方法主体集D2,构造注释集合D1’,并利用构造好的数据集训练Encoder‑Decoder自然语言句向量生成器模型M1,训练Encoder‑Decoder编程语言段落向量生成器模型M2;步骤3):抽取代码段集S中每个代码段的方法名称Name,并和该代码段映射后向量表示α’构成键值对形式,作为推荐时所用的索引文件;步骤4):对一个给定的自然语言查询,得到其对应的自然语言句向量,然后在带方法描述信息的代码段集S中对每个查询推荐最匹配的N个排好序的代码段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810371788.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:一种基于分解式图匹配的三维模型检索方法