[发明专利]一种面向对象的端到端对话生成方法、系统和介质在审
申请号: | 202111565743.X | 申请日: | 2021-12-20 |
公开(公告)号: | CN114372126A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 陈健;吴庆耀;薛志翔;谢方圆 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/211;G06F40/295 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 对象 端到端 对话 生成 方法 系统 介质 | ||
本发明公开了一种面向对象的端到端对话生成方法、系统和介质,方法包括下述步骤:以三元组的形式组成知识图,与历史对话信息一起作为输入信息;对历史对话信息进行分层编码以生成上下文对话表示;结合历史对话信息获得知识图中每个实体表示;通过双重注意力解码器将上下文对话表示和知识图的实体表示连接起来以生成最终的系统响应。本发明考虑到了知识图中的丰富结构或其与对话历史的内在关联,通过知识图的固有结构信息和对话历史中的潜在语义信息来有效地编码知识;同时本方法使用不依赖于特定的知识库和历史对话信息,具有很强的泛用性,并且对计算机的运算能力要求不高,具有很好的实用意义。
技术领域
本发明涉及对话生成的技术领域,具体涉及一种面向对象的端到端对话生成方法、系统和介质。
背景技术
近年来,人工智能及相关产业正迅速发展壮大,成为学术界、工业界以及世界各国政府关注的焦点。面向任务的对话系统已经成为一个越来越重要的研究领域,它需要理解人类的意图并通过自然语言生成正确的答案来完成指定的任务。具体来说,在对话系统中,对话话语和知识库是输入,相应的预测响应是通过理解对话历史、查询知识库和解释查询结果的输出。
现有的对话系统在知识融合方面存在一些问题,在给定上下文和知识库的情况下,系统回复不但要符合人类语言习惯,还应该涵盖正确的知识。现有的对话系统通常基于复制集支实现融合知识到对话生成,然而复制机制依赖于门来控制单词的分布,由于缺少明确的监督信息,容易使模型的效果次优。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种面向对象的端到端对话生成方法、系统和介质,本方法不依赖于特定的知识库和历史对话信息,通过知识图的固有结构信息和对话历史中的潜在语义信息来进行有效编码,具有较强的泛用性和实用性。
为了达到上述目的,本发明采用以下技术方案:
本发明一方面提供一种面向对象的端到端对话生成方法,包括下述步骤:
以三元组的形式组成知识图,并获取历史对话信息;
将历史对话信息进行分层编码以生成上下文对话表示;
结合历史对话信息获得知识图中每个实体表示;
通过双重注意力解码器将上下文对话表示和知识图的实体表示连接起来生成最终的系统响应。
作为优选的技术方案,所述以三元组的形式组成知识图,表示为:
G=(h,r,t)
其中,(h,t)∈ε,r∈R,ε表示知识图中的实体集合,R表示知识图中的关系集合。
作为优选的技术方案,所述历史对话信息表示为:
{(U1,S1),(U2,S2),…,(Ut,St)}
其中,t表示对话轮数;Ut表示用户的第t轮对话信息,St表示系统的第t轮对话信息。
作为优选的技术方案,所述将历史对话信息进行分层编码以生成上下文对话表示,具体为:
将历史对话信息通过双向门控循环单元获得历史对话信息的历史隐藏表示,公式为:
其中,表示第i轮历史对话中第Ti个词汇的隐藏表示,Ti表示第i轮历史对话中的词汇数目,BiGRU()表示双向门控循环单元,表示第i轮历史对话中的第t个词的向量表示,wi,t表示第i轮历史对话中的第t个词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111565743.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频编码优化方法和系统
- 下一篇:一种电子器件的下料设备及下料方法