[发明专利]基于混合知识管理的对话方法、装置和电子设备有效
| 申请号: | 202110407007.5 | 申请日: | 2021-04-15 |
| 公开(公告)号: | CN113158691B | 公开(公告)日: | 2023-02-28 |
| 发明(设计)人: | 黄民烈;高思林;高信龙一;彭伟;李荣军 | 申请(专利权)人: | 清华大学;华为技术有限公司 |
| 主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/211;G06F40/284;G06F16/33 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
| 地址: | 100084 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 混合 知识 管理 对话 方法 装置 电子设备 | ||
1.一种基于混合知识管理的对话方法,其特征在于,包括:
将当前轮次询问语句和对话模型上一轮次输出的回复语句拼接后进行向量化预处理,得到输入向量;
将所述输入向量和所述对话模型上一轮次输出状态关键词向量输入所述对话模型,输出当前轮次的回复语句和状态关键词向量;
其中,所述对话模型是基于对话数据集进行训练得到的,所述对话数据集中的每个对话数据均包括多轮询问语句样本,对应的多轮回复语句标签和多轮状态关键词标签,所述对话模型训练时以所述对话数据为单位进行训练,所述询问语句样本为结构化分词语句或非结构化分词语句;
所述对话模型的网络结构包括依次连接的上下文编码器、状态关键词解码器、混合知识管理库、文档编码器和回复解码器,所述对话模型还包括状态关键词编码器,所述状态关键词解码器、所述状态关键词编码器和所述回复解码器依次连接,具体包括:
所述对话模型的训练过程中,
所述上下文编码器将输入向量进行编码输出查询向量至所述回复解码器和所述状态关键词解码器,所述输入向量基于上一轮次的回复语句标签和当前轮次询问语句拼接后进行向量化预处理得到;
所述状态关键词解码器将上一轮次输出状态关键词向量进行解码输出预测状态关键词;
将当前轮次的状态关键词标签输入所述混合知识管理库输出查询结果至所述文档编码器,所述文档编码器输出查询结果向量至所述回复解码器;
将当前轮次的状态关键词标签输入所述状态关键词编码器进行编码生成当前轮次的状态关键词向量,所述状态关键词向量用于输入所述回复解码器和下一轮次的所述状态关键词解码器;
所述回复解码器基于输入的所述查询结果向量、查询向量和所述状态关键词向量进行解码输出当前轮次的预测回复语句。
2.根据权利要求1所述的基于混合知识管理的对话方法,其特征在于,所述对话模型训练过程中,任一对话数据中的每一轮次的询问回复训练结果均用于调节下一轮次的神经网络中的待优化参数;
对应地,所述对话模型训练过程中的损失函数L通过如下公式计算:
其中,为任一轮次的预测状态关键词在第i个位置分词的状态标签对应的向量,pb,i为所述任一轮次的状态关键词标签在第i个位置分词的状态标签对应的向量,为所述任一轮次的预测回复语句在第i个位置分词的回复标签对应的向量,pr,i为所述任一轮次的回复语句标签在第i个位置分词的回复标签对应的向量,Tb为所述预测状态关键词包括的分词数量,Tr为所述预测回复语句包括的分词数量。
3.根据权利要求1所述的基于混合知识管理的对话方法,其特征在于,所述对话模型训练过程中,对于任一对话数据,所有轮次询问回复训练结果总合用于调节下一对话数据进行训练时的神经网络中的待优化参数;
对应地,所述对话模型训练过程中的损失函数L通过如下公式计算:
其中,为任一对话数据第t轮次的预测状态关键词在第i个位置分词的状态标签对应的向量,为所述任一对话数据第t轮次的状态关键词标签在第i个位置分词的状态标签对应的向量,为任一对话数据第t轮次的预测回复语句在第i个位置分词的回复标签对应的向量,为任一对话数据第t轮次的回复语句标签在第i个位置分词的回复标签对应的向量,第i轮次的状态关键词标签对应的向量,Tb为所述预测状态关键词包括的分词数量,Tr为所述预测回复语句包括的分词数量,t=1,2,…,N,N为所述任一对话数据中询问回复次数。
4.根据权利要求1-3中任一项所述的基于混合知识管理的对话方法,其特征在于,所述上下文编码器的网络结构为双向GRU;
对应地,所述状态关键词解码器的网络结构为单向GRU,所述状态关键词编码器的网络结构为双向GRU,所述回复解码器的网络结构为单向GRU,所述文档编码器的网络结构为双向GRU。
5.根据权利要求1-3中任一项所述的基于混合知识管理的对话方法,其特征在于,所述状态关键词编码器和所述状态关键词解码器之间使用了注意力机制和拷贝机制,所述上下文编码器、所述文档编码器、所述状态关键词编码器和所述回复解码器之间使用了注意力机制和拷贝机制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;华为技术有限公司,未经清华大学;华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110407007.5/1.html,转载请声明来源钻瓜专利网。





