[发明专利]一种多情景对话切换方法及装置有效
| 申请号: | 201910477037.6 | 申请日: | 2019-06-03 |
| 公开(公告)号: | CN110377708B | 公开(公告)日: | 2021-10-08 |
| 发明(设计)人: | 杜剑文;李辉权 | 申请(专利权)人: | 广东幽澜机器人科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谢泳祥 |
| 地址: | 510000 广东省广州市天河区体育西路*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多情 对话 切换 方法 装置 | ||
1.一种多情景对话切换方法,其特征在于,所述方法包括以下步骤:
步骤1,机器人客服接收到来自用户客户端的会话消息数据;
步骤2,将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度;
步骤3,按分类置信度切换到知识库中的场景;
步骤4,按照场景选择知识库中的应答消息数据;
步骤5,将应答消息数据推送给用户客户端;
其中,在步骤2中,所述将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度的方法包括以下步骤:
令会话消息数据的文本S,知识库中的应答消息数据的语句文本为Si,i=1…n,n为知识库中的应答消息数据数量,则通过S与Si之间的语义距离来计算文本的内容相似度,将S与Si之间的分类置信度定义为:dist(S,Si)=1-Sim(S,Si),其中,Sim(S,Si)表示S与Si的相似度,其中,语句相似值wij的值的计算方法为,令S的主题词为word,Si的主题词为wordj,freqi,j表示主题词wordj在Si出现的频率,j代表主题词wordj在Si中出现第j次,则语句相似值wij的值为,
其中,mi,j,表示搭配j在标注为义项i的知识库中的期望平均值,
其中:freq为主题词word在S出现的频率,freqi,j表示主题词wordj在Si出现的频率;
其中,Sim(S,Si)∈[0,1],故S与Si的分类置信度的取值范围为区间[0,1]之间,分类置信度越小,表明分类置信度越高,类型越相似。
2.根据权利要求1所述的一种多情景对话切换方法,其特征在于,在步骤1中,所述会话消息数据的形式包括以下至少一种:自然语言文字组成的语句、数据链接、语音,如果是数据链接、语音则将数据链接、语音转换为文本形式的语句作为会话消息数据。
3.根据权利要求1所述的一种多情景对话切换方法,其特征在于,所述知识库包括多个场景分类,每个场景分类包括多个应答消息数据的语句文本。
4.根据权利要求1所述的一种多情景对话切换方法,其特征在于,抽取S的主题词word与Si的主题词wordj的方法为LDA、TextRank、GibbsLDA任意一种主题词抽取方法。
5.根据权利要求1所述的一种多情景对话切换方法,其特征在于,在步骤3中,按分类置信度切换到知识库中的场景的方法为,如果当前的场景为知识库中分类置信度最小的应答消息数据所属的场景则不进行切换,否则选取并切换到知识库中分类置信度最小的应答消息数据所属的场景。
6.根据权利要求1所述的一种多情景对话切换方法,其特征在于,在步骤4中,按照场景选择知识库中的应答消息数据的方法为,选择并返回知识库中分类置信度最小的应答消息数据,或按照现有的场景中的对话进行用户的应答方法进行返回应答消息数据。
7.一种多情景对话切换装置,其特征在于,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
会话读取单元,用于机器人客服接收到来自用户客户端的会话消息数据;
置信度计算单元,用于将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度;
场景切换单元,用于按分类置信度切换到知识库中的场景;
应答消息单元,用于按照场景选择知识库中的应答消息数据;
消息推送单元,用于将应答消息数据推送给用户客户端;
其中,所述将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度的方法包括以下步骤:
令会话消息数据的文本S,知识库中的应答消息数据的语句文本为Si,i=1…n,n为知识库中的应答消息数据数量,则通过S与Si之间的语义距离来计算文本的内容相似度,将S与Si之间的分类置信度定义为:dist(S,Si)=1-Sim(S,Si),其中,Sim(S,Si)表示S与Si的相似度,其中,语句相似值wij的值的计算方法为,令S的主题词为word,Si的主题词为wordj,freqi,j表示主题词wordj在Si出现的频率,j代表主题词wordj在Si中出现第j次,则语句相似值wij的值为,
其中,mi,j,表示搭配j在标注为义项i的知识库中的期望平均值,
其中:freq为主题词word在S出现的频率,freqi,j表示主题词wordj在Si出现的频率;
其中,Sim(S,Si)∈[0,1],故S与Si的分类置信度的取值范围为区间[0,1]之间,分类置信度越小,表明分类置信度越高,类型越相似。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东幽澜机器人科技有限公司,未经广东幽澜机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910477037.6/1.html,转载请声明来源钻瓜专利网。





