[发明专利]扩展问评价方法及装置有效
申请号: | 201710439654.8 | 申请日: | 2017-06-12 |
公开(公告)号: | CN107229733B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 李陟;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 31100 上海专利商标事务所有限公司 | 代理人: | 徐伟 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 复杂度 知识库 对照表 聚类处理 数目确定 质量信息 预设 关联 | ||
本发明提供了一种用于评价知识库中扩展问的扩展问质量的方法,该知识库包括多个标准问,每个标准问具有关联的多个扩展问,每个扩展问是相应标准问的相似问法,该方法包括:对各个标准问下的扩展问执行不预设聚类数量的聚类处理,以将每个标准问下的扩展问聚类为多个聚类;基于聚类的数目确定扩展问复杂度;以及将扩展问复杂度与复杂度对照表相对照以获得扩展问质量信息。
技术领域
本发明涉及人机交互技术领域,尤其涉及用于评价知识库中扩展问的扩展问质量的方法和装置。
背景技术
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。
智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。
知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本发明中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。
用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。然而,用户往往并非使用的是标准问,而是标准问的一些变形的形式。例如,若对于收音机的电台切换的标准问形式是“换一个电台”,那么用户可能使用的命令是“切换一个电台”,机器也需要能够识别用户表达的是同一个意思。
因此,对于智能语义识别而言,知识库里需要有标准问的扩展问,该扩展问与标准问表达形式有略微差异,但是表达相同的含义。在用户输入用户问句后,主要依靠扩展问来实现用户问句与标准问的匹配。
作为示例,可以将用户问句与知识库中所有标准问的所有扩展问执行语义相似度计算,找出与该用户问句具有最高语义相似度的扩展问,若该最高语义相似度高出系统所设的阈值,则该扩展问所对应的标准问被认为是与该用户问句相匹配的标准问,进而将该标准问所对应的知识点中的答案反馈给用户。另一方面,若计算出的该最高语义相似度低于系统所设的该阈值,则认为标准问匹配失败。此时,可向用户反馈语义识别失败,提示用户可再次输入。
由此,扩展问的质量至关重要。目前人工智能领域主要还是依靠人工整理扩展问的方式,因为整理的内容多,测试中一直存在效率和效果不能兼得的问题。即如果抽测的内容少,结果的随机性就大,如果抽测的内容多,则相当于测试人员重做知识库。
因此,一种高效地评价扩展问质量的方案是本领域所希望的。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
根据本发明的一方面,提供了一种用于评价知识库中扩展问的扩展问质量的方法,该知识库包括多个标准问,每个标准问具有关联的多个扩展问,每个扩展问是相应标准问的相似问法,该方法包括:对各个标准问下的扩展问执行不预设聚类数量的聚类处理,以将每个标准问下的扩展问聚类为多个聚类;基于聚类的数目确定扩展问复杂度;以及将扩展问复杂度与复杂度对照表相对照以获得扩展问质量信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710439654.8/2.html,转载请声明来源钻瓜专利网。