[发明专利]一种对话生成的方法、装置、存储介质及电子设备有效
申请号: | 201910650460.1 | 申请日: | 2019-07-18 |
公开(公告)号: | CN110347368B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 李纪为 | 申请(专利权)人: | 北京香侬慧语科技有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 丁曼曼 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 生成 方法 装置 存储 介质 电子设备 | ||
本发明提供了一种对话生成的方法、装置、存储介质及电子设备,其中,该方法包括:获取源序列,根据源序列生成具有最大概率的、预设数量的目标序列,并确定每个目标序列的正向概率;确定每个目标序列的反向概率;根据每个目标序列的正向概率和反向概率分别确定每个目标序列的双向互信息,双向互信息与正向概率和反向概率之间均为正相关关系;将具有最大双向互信息的目标序列作为与源序列相对应的有效序列。通过本发明实施例提供的对话生成的方法、装置、存储介质及电子设备,可以更加准确地得到高质量、有用的下文回复,减少对话过程中生成无意义的回复。
技术领域
本发明涉及对话生成的技术领域,具体而言,涉及一种对话生成的方法、装置、存储介质及电子设备。
背景技术
在现有的对话系统中,一般利用序列到序列模型(sequence-to-sequence model)生成对话回复。基于深度学习的序列到序列模型是编码-解码(encoder-decoder模型),其提供了一种基于源语言序列(source,也就是上文),生成目标语言序列(target,也就是对话回复)的普适解决方法。
然而,在对话系统中,序列到序列模型存在着非常严重的一个问题,就是不管用户输入的句子是什么,系统的回复都是高频的通用回复,比如“我不知道”、“那太好了”等。
例子1:
用户句子:你在哪里出生?
系统应答:我不知道。
例子2:
用户句子:你今年几岁了?
系统应答:我不知道。
例子3:
用户句子:我要去杭州出差。
系统应答:那太好了!
发明内容
为解决上述问题,本发明实施例的目的在于提供一种对话生成的方法、装置、存储介质及电子设备。
第一方面,本发明实施例提供了一种对话生成的方法,包括:
获取源序列,根据所述源序列生成具有最大概率的、预设数量的目标序列,并确定每个所述目标序列的正向概率,所述正向概率为基于所述源序列生成所述目标序列的概率;
确定每个所述目标序列的反向概率,所述反向概率为基于所述目标序列预测生成所述源序列的概率;
根据每个所述目标序列的正向概率和反向概率分别确定每个所述目标序列的双向互信息,所述双向互信息与所述正向概率和所述反向概率之间均为正相关关系;
将具有最大双向互信息的目标序列作为与所述源序列相对应的有效序列。
第二方面,本发明实施例还提供了一种对话生成的装置,包括:
正向概率确定模块,用于获取源序列,根据所述源序列生成具有最大概率的、预设数量的目标序列,并确定每个所述目标序列的正向概率,所述正向概率为基于所述源序列生成所述目标序列的概率;
反向概率确定模块,用于确定每个所述目标序列的反向概率,所述反向概率为基于所述目标序列预测生成所述源序列的概率;
双向互信息确定模块,用于根据每个所述目标序列的正向概率和反向概率分别确定每个所述目标序列的双向互信息,所述双向互信息与所述正向概率和所述反向概率之间均为正相关关系;
有效序列确定模块,用于将具有最大双向互信息的目标序列作为与所述源序列相对应的有效序列。
第三方面,本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于上述任意一项所述的对话生成的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京香侬慧语科技有限责任公司,未经北京香侬慧语科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910650460.1/2.html,转载请声明来源钻瓜专利网。