[发明专利]一种面向软件开发问题的答案自动生成方法有效
申请号: | 201910620492.7 | 申请日: | 2019-07-10 |
公开(公告)号: | CN110390049B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 孙海龙;王旭;张振羽;刘旭东 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 软件 开发 问题 答案 自动 生成 方法 | ||
本发明提出一种面向软件开发问题的答案自动生成方法,包括以下步骤:步骤1,对于一个开发者的问题,使用已有的Web搜索工具,从多个软件开发问答论坛网站搜索相关问答帖子;步骤2,对搜索到的帖子采用三种算法对不重要句子进行过滤,形成了输入问题的上下文,所述上下文指与提问问题相关的包含解决该问题相关知识的多条帖子在经过句子过滤后构成的文本集合;步骤3,将所述问题和所述上下文送入基于深度机器阅读理解的答案生成网络AnswerNet,所述答案生成网络理解所述上下文和所述问题的语义信息,并且从上下文里选择对回答问题最有用的文本块进行组合,最终生成该问题的答案。
技术领域
本发明涉及一种自动生成方法,尤其涉及一种面向软件开发问题的答案自动生成方法。
背景技术
在软件开发的过程中,开发人员通常会遇到Bug调试、如何调用API等各类软件开发问题。为了解决这些问题,人们在互联网上已经建立了博客、在线问答论坛等软件开发社区。例如:Stack Overflow,CSDN等等。在这些社区平台上,任何一个开发者可以进行提问,其他能够回答这些问题的开发者都可以为该问题提供自己的答案,而提问者会标记能够解决问题的答案为被接受答案。
尽管这些社区为开发者提供了一种可以在线讨论问题和分享(获得)答案的平台,但是并无法保证问题可以及时得到回复。由于大量用户的参与和分享,这些开发社区蕴含着大量解决开发者问题的知识,但是这些知识碎片化严重,社区平台也缺乏对知识间的关联性的分析。因此,用户不得不阅读大量相关的帖子来获取所需要的知识,虽然目前有一些方法可以帮助用户获取所需问答信息,但是直接生成可用答案的方法尚不成熟。
为了帮助开发者高效地利用这些现存的知识,现有技术分为以下三类:
1)软件开发领域相关的信息检索优化技术。这类方法一般涉及到对程序API信息、软件开发相关问题和开发文档等的检索。在检索过程中,会对诸如API的文档等待检索对象进行分析,抽取相应的专业名词,API功能描述,API用法描述等等一系列的特征,然后对相应的检索问题,进行特征匹配,按照匹配度进行排序返回结果。
2)关键信息摘要抽取技术。这类方法一般采取诸如MMR等重要语句抽取技术,对检索结果,抽取每个段落的首句子等信息,对检索内容进行总结,旨在帮助开发者了解检索内容的主题和概要信息。
3)基于语义分析的检索重排技术。这类方法一般采用语义分析方法,对检索内容进行语义分析,并对各条内容之间的关系进行建模,进而用以优化检索结果。在进行语义分析时,现阶段的方法主要采用深度学习相关技术对文本信息进行编码和特征抽取,然后采用编码结果和抽取到的特征对检索结果进行重排和过滤。
虽然现有技术可以在一定程度上帮助软件开发者更好地获取所需的知识,但是存在着一些较为显著地问题:
1)基于检索的方式无法考虑语义信息,缺乏对文本内容的深度理解。仅仅依据关键字/短语的匹配,只能找到浅层表达比较相似的文本信息,但是对开发者而言,“有用信息”不等于“相似信息”,因此存在着检索匹配结果与真实所需结果不一致的问题。
2)目前软件开发问答领域基于摘要抽取的技术同样也匮乏对语义的深度理解,而且“重要的信息”也不能等同于“有用信息”,存在着抽取的摘要与需求结果不一致的问题。
3)基于语义分析的技术,现阶段采用的语言模型过于陈旧,而且多是基于深度语义相似性进行检索优化,获取较为相似的文本信息。
总之,对于给定的问题,现有技术尚无直接生成有用答案的方法,现存技术大多都是围绕着信息的查找而设计,缺乏对已有信息进行理解整理并生成有用答案的方法。
发明内容
本发明提出的一种面向软件开发问题的答案自动生成方法,
附图说明
图1为本发明的整体流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910620492.7/2.html,转载请声明来源钻瓜专利网。