[发明专利]一种问答系统评价方法和装置有效

申请号：	201710265734.6	申请日：	2017-04-21
公开（公告）号：	CN108733712B	公开（公告）日：	2021-03-30
发明（设计）人：	林江华	申请（专利权）人：	北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06Q10/06
代理公司：	中原信达知识产权代理有限责任公司 11219	代理人：	张一军;姜劲
地址：	100195 北京市海淀区杏石口路6***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种问答系统评价方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种问答系统评价方法、装置、电子设备和可读存储介质。其中所述问答系统评价方法包括：根据用户输入，通过邀评概率计算搜集测试语料；利用所述测试语料，通过聚类对问答系统进行测试；根据测试结果更新知识库。

技术领域

本发明涉及计算机领域，尤其涉及一种问答系统评价方法、装置、电子设备和可读存储介质。

背景技术

在人机交互过程中通常需要使用问答系统(Question Answer System,QA)。问答系统又称人机对话系统(Human-machine conversation,HMC)，是指这样的一个机器系统：能够对于用户通过自然语言输入的问句，给出简洁、准确、人性化的回答，这种回答通常是指一小段文本。

现有的问答系统，大致可以分为：聊天机器人、基于知识库的问答系统、问答式检索系统、基于自由文本的问答系统等。基于知识库的问答系统为拥有一个或多个知识库，并利用检索、推理等技术，来理解与求解用户问题的问答系统，也被称为基于知识库的智能问答系统。

在对基于知识库的智能问答系统进行评价时，准确率、召回率是目前广泛应用于问答系统的两个度量值，用来评价问答系统的质量。其中准确率是回答正确问题数与回答上的问题总数的比率，衡量的是问答系统的查准率；召回率是指回答正确问题数和测试集中所有正确回答问题数的比率，衡量的是问答系统的查全率。其定义为：

正确率＝回答正确问题条数/回答上的问题总数

召回率＝回答正确问题条数/测试集中所有正确回答问题数

其中，两者取值在0和1之间，数值越接近1，查准率或查全率就越高。

现有技术中的问答系统评价方法主要有人工标注和用户评价两种，其中，

人工标注的步骤为：

1.通过网络搜索或聊天记录提取等方式，生成待测试集；

2.利用问答系统回答测试问题集中的问题，将答案附加到对应问题后，形成待标注数据；

3.标注人员对步骤2中生成的待标注数据进行判别，标注每个答案为正确或错误；

4.利用步骤3中的数据计算准确率和召回率。

用户评价系统的步骤为：