[发明专利]对话处理方法、装置、电子设备及存储介质在审
申请号: | 202211076682.5 | 申请日: | 2022-09-02 |
公开(公告)号: | CN115455161A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 田昕;林英展;宋梦菲;鲍思琪;黄世维 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/35 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 孟洋 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了对话处理方法、装置、电子设备及存储介质,涉及人工智能领域,尤其涉及自然语言处理、智能搜索、深度学习技术领域。具体实现方案为:获取对话过程中的对话文本,其中,对话文本包括当前问题文本,或者,对话文本包括当前问题文本以及历史对话文本;对对话文本进行提取处理,获取当前查询文本;根据当前查询文本查询知识数据库,获取当前查询文本的知识查询结果;根据知识查询结果和对话文本,确定当前问题文本的回复文本,从而实现获取知识查询结果与回复文本生成的解耦,不需要将知识数据库编码到对话模型中或者输入对话模型中,只需在查询时结合当前查询文本和知识数据库进行查询,且提高领域自适应能力。
技术领域
本公开涉及人工智能技术领域,尤其涉及自然语言处理、智能搜索、深度学习技术领域,尤其涉及一种对话处理方法、装置、电子设备及存储介质。
背景技术
任务式对话(Task-Oriented Dialogue,TOD)系统主要有两类,一类是端到端的TOD系统,一类是流水线式的TOD系统。
端到端的TOD系统中,对话处理的一种方式中,将对话历史和整个数据库编码到模型中,模型参数更新时计算量大,联合优化困难;对话处理的另一种方式中,将对话历史和整个数据库作为输入序列,由于数据库的规模,输入序列容易变得很长,无法放入到transformer结构中。流水线式的TOD系统中,需要严重依赖于预定义的对话schema(模式),而对话schema与既有的数据库强绑定,领域自适应能力差。
发明内容
本公开提供了一种对话处理方法、装置、电子设备及存储介质。
根据本公开的一方面,提供了一种对话处理方法,包括:获取对话过程中的对话文本,其中,所述对话文本包括当前问题文本,或者,所述对话文本包括所述当前问题文本以及历史对话文本;对所述对话文本进行提取处理,获取当前查询文本;根据所述当前查询文本查询知识数据库,获取所述当前查询文本的知识查询结果;根据所述知识查询结果和所述对话文本,确定所述当前问题文本的回复文本。
根据本公开的另一方面,提供了一种对话模型的训练方法,包括:获取初始的对话模型以及训练数据,其中,所述训练数据包括:第一训练样本和第二训练样本,所述第一训练样本包括样本对话文本和样本查询文本;所述第二训练样本包括:样本对话文本、样本知识查询结果和样本回复文本;采用所述第一训练样本以及第一提示信息对初始的对话模型进行训练,并采用所述第二训练样本和第二提示信息对所述对话模型进行训练,得到训练好的对话模型;其中,所述第一提示信息用于提示所述对话模型进行查询文本的提取处理;所述第二提示信息用于提示所述对话模型进行回复文本的生成处理。
根据本公开的再一方面,提供了一种对话模型的训练方法,包括:获取初始的对话模型,其中,所述对话模型包括:查询生成网络和回复生成网络;获取训练数据,其中,所述训练数据包括:第一训练样本和第二训练样本,所述第一训练样本包括样本对话文本和样本查询文本;所述第二训练样本包括:样本对话文本、样本知识查询结果和样本回复文本;所述样本知识查询结果,为所述样本查询文本的知识查询结果;采用所述第一训练样本对所述对话模型中的所述查询生成网络进行训练,得到训练好的查询生成网络;采用所述第二训练样本对所述对话模型中的回复生成网络进行训练,得到训练好的回复生成网络。
根据本公开的又一方面,提供了一种对话模型的训练装置,包括:第一获取模块,用于获取对话过程中的对话文本,其中,所述对话文本包括当前问题文本,或者,所述对话文本包括所述当前问题文本以及历史对话文本;处理模块,用于对所述对话文本进行提取处理,获取当前查询文本;第二获取模块,用于根据所述当前查询文本查询知识数据库,获取所述当前查询文本的知识查询结果;确定模块,用于根据所述知识查询结果和所述对话文本,确定所述当前问题文本的回复文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211076682.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于图像处理的监控方法及系统
- 下一篇:基于点云的物体分类方法及相关设备