[发明专利]一种面向程序设计领域问答系统的知识库构建方法及装置在审
申请号: | 201810454306.2 | 申请日: | 2018-05-14 |
公开(公告)号: | CN108717433A | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 薛景;史立丽;黄寄;陈仁祥;武鹏超 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识库 知识库构建 程序设计 问答系统 用户满意 答案 返回 缓存 相似度分析 相似度计算 相似度排序 准确度 答疑系统 获取信息 教学效果 评测系统 实时检测 同步更新 问题语句 用户问题 语句分词 在线测评 知识内容 时间差 智能 近义词 相似度 准确率 算法 替换 搜索 优化 | ||
一种面向程序设计领域问答系统的知识库构建方法及装置,包括如下步骤,根据在线测评系统的知识内容初步建立智能问答知识库;获取用户问题,并将问题的语句分词后进行近义词替换,再与知识库中内容进行相似度计算;通过相似度分析获取问题语句的结果,并将结果按相似度排序,返回相似度最高的答案至用户;若用户满意当前返回答案,则根据问答同步更新智能问答知识库,并通过运用代码相似算法实时检测缓存中的数据;否则,返回次优答案至用户,直至用户满意为止。本系统可以克服传统在线课后答疑系统中存在的时间差、搜索准确度低、效率有待提高等问题,有效提高用户获取信息的速度和准确率,同时优化在线评测系统的教学效果。
技术领域
本发明属于计算机数据处理技术领域,具体涉及一种面向程序设计领域问答系统的知识库构建方法及装置。
背景技术
智能问答系统是基于高速发展的互联网提供的海量数据,通过问题分析和数据处理,对待解决的现实问题进行解答的智能系统。此系统可以大幅度提高用户获取信息的速度和准确率。
据申请人了解,现有的智能问答系统主要是基于在线问答知识库和互联网中庞大的数据库,通过对历史用户问答信息、海量网络数据进行挖掘,计算用户问题语句与已有问答对中问题语句之间的相似度,将相似度最高的问答对中的答案返回给用户。同时将用户反馈的答案评价作为依据,判断答案优劣,并根据用户问答情况同步更新建立后的知识库。
然而,上述智能问答系统存在的缺陷在于:由于不同计算机程序语言的语法具有较大差异,少数情况下系统得到的问题的答案不够准确。
发明内容
本发明的目的在于:提供一种面向程序设计领域问答系统的知识库构建方法及装置,可以有效提高用户获取信息的速度和准确率,并能优化在线评测系统的教学效果。
为了达到以上目的,一种面向程序设计领域问答系统的知识库构建方法,包括如下步骤,
根据在线测评系统的知识内容初步建立智能问答知识库;
获取用户问题,并将问题的语句分词后进行近义词替换,再与知识库中内容进行相似度计算;
通过相似度分析获取问题语句的结果,并将结果按相似度排序,返回相似度最高的答案至用户;
若用户满意当前返回答案,则根据问答同步更新智能问答知识库,并通过运用代码相似算法实时检测缓存中的数据;否则,返回次优答案至用户,直至用户满意为止。
本发明的优选方案是:问题的语句分词具体为:
首先输入需要分词的字符串和所控制的分词模式,再根据分词模式将字符串分词,字符串可为UTF-8字符串或GBK字符串
优选地,通过相似度分析获取问题语句的结果,并将结果按相似度排序,具体为:
在智能问答知识库中检索匹配相似度高的回答对,若知识库中不存在,则通过爬虫机制从网络中抓取相似度高的结果进行反馈。
优选地,返回次优答案至用户,具体为:
依照相似度排序的结果,返回相似度次高的答案,再根据反馈至用户后收到的用户评价,不满意则继续返回下一相似度高的答案,直至用户满意为止。
优选地,根据问答同步更新智能问答知识库,具体为:
运用代码相似度算法,实时从课后答疑系统的知识内容中将相似的答案归类为同一个问题的不同答案;若原有知识库中未找到相似度足够高的问答对或用户未从原有知识库的返回答案中找到满意答案时,则从网络上爬取返回给用户的满意答案进行保存,创建新的问答对。
本发明还提供一种面向程序设计领域问答系统的知识库构建装置,包括:
预置知识库单元,用于根据在线测评系统的知识内容初步建立智能问答知识库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810454306.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:资源查询方法及装置
- 下一篇:一种混合逐点策略和成对策略的文本排序方法