[发明专利]基于动态多形式知识融合的开放域对话生成方法在审
申请号: | 202211549074.1 | 申请日: | 2022-12-05 |
公开(公告)号: | CN115905491A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 徐菲菲;周珊琳 | 申请(专利权)人: | 上海电力大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/35;G06N3/0455;G06N3/047;G06N3/042;G06N3/082;G06N5/022 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 陈龙梅 |
地址: | 201306 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 形式 知识 融合 开放 对话 生成 方法 | ||
1.一种基于动态多形式知识融合的开放域对话生成方法,其特征在于,包括:对话模块和动态多形式知识融合模块,
其中,所述对话模块包括第一Transformer编码器模块、第二Transformer编码器模块、第三Transformer编码器模块、Transformer解码器模块和控制器模块,
所述动态多形式知识融合模块包括虚拟知识推理模块、虚拟知识动态记忆模块、虚拟知识动态选择模块和常识知识扩展模块,
所述虚拟知识推理模块,将用户输入Xn输入虚拟知识推理模型得到候选文档集合按照候选文档集合中各个候选文档的过滤分数从高到低进行排列,选择前T个候选文档作为候选文档集合
所述第一Transformer编码器模块,将所述候选文档集合进行编码得到语义特征矩阵
所述第二Transformer编码器模块,对所述用户输入Xn进行编码得到语义信息
所述虚拟知识动态记忆模块,将当前对话之前得到的所有历史语义特征矩阵集合动态存储为矩阵H,根据所述语义信息基于注意力机制对所述矩阵H进行过滤和筛选得到历史虚拟知识
所述第三Transformer编码器模块,对历史对话Cn和所述用户输入Xn进行编码得到语义信息
所述虚拟知识动态选择模块,基于多头注意力机制,对所述语义信息所述历史虚拟知识和所述语义特征矩阵进行整合,得到融合语义特征和虚拟知识特征的向量
所述常识知识扩展模块,通过遍历常识知识图谱ConceptNet,对所述历史对话Cn、所述用户输入Xn和所述候选文档集合中的信息进行概念扩展、编码和特征提取得到扩展知识
所述Transformer解码器模块,基于上一时刻的生成单词对所述向量进行解码,得到解码后隐藏层状态
所述控制器模块,将所述解码后隐藏层状态经Softmax函数计算得到生成单词在对话标准词汇表的概率分布A,通过所述扩展知识得到生成单词在扩展知识实体集合的概率分布B,基于门控机制根据所述概率分布A和所述概率分布B得到当前时刻的生成单词
通过多次循环调用所述Transformer解码器模块和所述控制器模块,得到当前对话回合内所有时刻的生成单词集合输出所述生成单词集合Y作为对所述用户输入Xn的回复。
2.根据权利要求1所述的基于动态多形式知识融合的开放域对话生成方法,其特征在于:
其中,所述虚拟知识推理模型由对话数据集和虚拟知识库对基于虚拟知识库推理算法DrKIT的模型进行训练得到。
3.根据权利要求2所述的基于动态多形式知识融合的开放域对话生成方法,其特征在于:
其中,所述对话数据集为开源对话数据集DailyDialog和PersonaChat。
4.根据权利要求2所述的基于动态多形式知识融合的开放域对话生成方法,其特征在于:
其中,所述虚拟知识库通过对常识故事数据集ROCStories进行索引化得到。
5.根据权利要求1所述的基于动态多形式知识融合的开放域对话生成方法,其特征在于:
其中,所述过滤分数为所述候选文档与单词集合中的词共现的次数,所述单词集合由所述用户输入Xn和所述用户输入Xn基于所述常识知识图谱ConceptNet得到的相关词组成,且所述单词集合中没有重复的词。
6.根据权利要求1所述的基于动态多形式知识融合的开放域对话生成方法,其特征在于:
其中,所述T的取值为5。
7.根据权利要求1所述的基于动态多形式知识融合的开放域对话生成方法,其特征在于:
其中,所述常识知识扩展模块的概念扩展、编码和特征提取的方法为:
从所述历史对话Cn、所述用户输入Xn和所述候选文档集合中抽取单词集合作为原始实体通过遍历所述常识知识图谱ConceptNet,得到所述原始实体的关联词集合作为扩展实体根据所述常识知识图谱ConceptNet获得所述原始实体和所述扩展实体中各对应单词的关系集合作为关系基于神经网络CompGCN分别对所述原始实体所述扩展实体和所述关系进行编码,分别得到编码向量编码向量和编码向量根据所述编码向量所述编码向量和所述编码向量通过注意力机制得到所述扩展知识
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力大学,未经上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211549074.1/1.html,转载请声明来源钻瓜专利网。