[发明专利]基于跨语言知识的对话方法及系统有效
申请号: | 202110577065.2 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113486160B | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 任昭春;任鹏杰;陈竹敏;孙维纬;孟川;马军 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 266237 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语言 知识 对话 方法 系统 | ||
本发明属于跨语言对话领域,提供了一种基于跨语言知识的对话方法及系统。其中,该方法包括获取对话问题并经多语言编码器得到对话问题表示向量;在预先存储多语言知识表示向量库中,检索出与对话问题表示向量最近的知识表示向量;将对话问题表示向量与检索出的知识表示向量进行拼接;将拼接后的向量输入至跨语言seq2seq模型,得到对话问题所对应的回复。
技术领域
本发明属于对话系统领域,尤其涉及一种基于跨语言知识的对话方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
近年来,闲聊式的对话系统得到了很大的发展。基于seq2seq结构的模型,可以根据对话的历史,生成流畅的回复。但人们在与这样的系统交互的时候,仍然可以感受到和与真人聊天的差距。导致这一问题的一个重要的原因是,聊天系统在生成回复的时候由于缺乏相关知识,很难深入一个特定的主题。为了解决这一问题,基于知识的对话(KGC)被提出,利用外部知识来增强对话系统。
但是,现有的KGC相关的研究,都使用了大规模的本语言知识。然而,发明人发现,不同语言下可获取的知识数量是很不平衡的,比如英文的维基知识库是中文的6倍,而世界上使用人数第七的孟加拉语,可获取的知识只有英语的约1/60。而由于极高的资源开销,为每个语言构建足够大的知识库是不现实的。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于跨语言知识的对话方法及系统,其能够提升对话系统的话题丰富度,避免重复构建单语言知识库的开销。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于跨语言知识的对话方法。
一种基于跨语言知识的对话方法,包括:
获取对话问题并经多语言编码器得到对话问题表示向量;
在预先存储多语言知识表示向量库中,检索出与对话问题表示向量最近的知识表示向量;
将对话问题表示向量与检索出的知识表示向量进行拼接;
将拼接后的向量输入至跨语言seq2seq模型,得到对话问题所对应的回复。
本发明的第二个方面提供一种基于跨语言知识的对话系统。
一种基于跨语言知识的对话系统,其包括:
对话问题编码模块,其用于获取对话问题并经多语言编码器得到对话问题表示向量;
知识表示向量检索模块,其用于在预先存储多语言知识表示向量库中,检索出与对话问题表示向量最近的知识表示向量;
向量拼接模块,其用于将对话问题表示向量与检索出的知识表示向量进行拼接;
对话问题回复模块,其用于将拼接后的向量输入至跨语言seq2seq模型,得到对话问题所对应的回复。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于跨语言知识的对话方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于跨语言知识的对话方法中的步骤。
与现有技术相比,本发明的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110577065.2/2.html,转载请声明来源钻瓜专利网。