[发明专利]一种人机对话方法及系统在审
申请号: | 202110200723.6 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112883179A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 陈欢欢;范祖宁 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/289;G06F40/216;G06F40/126;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘乐 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机对话 方法 系统 | ||
本发明公开了一种人机对话方法及系统,对获取的当前对话语句进行预处理得到词向量序列,将词向量序列输入至句子分类模型,得到当前对话语句的句子功能标签,将词向量序列和句子功能标签输入至生成式对话模型,采用生成式对话方法输出当前对话语句的回答语句。本发明通过在训练句子分类模型的句子功能标签中的增加一定比例的疑问句,使得生成式对话模型输出的回答语句包含一定比例的疑问句,为避免出现生成式对话模型在应当输出疑问句,而错误的输出其他句型的情况,本发明引入了损失函数,通过采用反向传播算法调整模型参数,得到损失函数收敛为最小值时的生成式对话模型,该模型可以拟合实际对话语句的回答语句类型实现人机对话时的主动对话。
技术领域
本发明涉及自然语言处理技术领域,更具体的说,涉及一种人机对话方法及系统。
背景技术
对话系统又称为交互式对话智能体或聊天机器人,具有非常广泛的应用,如技术支持、娱乐等。在对话系统中,一般用户提问的问题通过一轮对话即可解决,但是在实际应用中,更常见的场景为多轮对话,用户往往会针对对话系统的回答进行新的提问,或者展开相关的交互。
然而,目前对于对话系统的研究,多为一问一答的形式,即用户提问一个问题,对话系统回答一个问题,该问答方式类似于信息检索形式,由于对话系统从用户处所获得的有效信息较少,因此影响了对话交互的有效性,使得人机对话不能很好的延续,与日常生活中的对话存在较大差别,从而使得用户体验效果不佳。
发明内容
有鉴于此,本发明公开一种人机对话方法及系统,以实现人机对话时的主动对话,提高用户体验。
一种人机对话方法,包括:
获取当前对话语句;
对所述当前对话语句进行预处理,得到词向量序列;
将所述词向量序列输入至预先训练的句子分类模型,得到所述当前对话语句的句子功能标签,所述句子分类模型为以对话语句的词向量序列作为训练样本,以句子功能标签作为标签训练得到,其中,训练所述句子分类模型的句子功能标签中的疑问句比例在预设比例区间内;
将所述词向量序列和所述句子功能标签输入至预先训练的生成式对话模型,采用生成式对话方法输出所述当前对话语句的回答语句,其中,所述生成式对话模型在训练过程中采用反向传播算法进行学习,且损失函数收敛为最小值,所述损失函数用于表征所述生成式对话模型输出的回答语句的分类概率相对于参考回答语句的分类概率的损失情况。
可选的,所述对所述当前对话语句进行预处理,得到词向量序列,具体包括:
对所述当前对话语句进行分词得到单词序列;
对所述单词序列中的每个单词进行词嵌入处理,将每个所述单词转换为词向量,得到所述词向量序列。
可选的,所述将所述词向量序列和所述句子功能标签输入至预先训练的生成式对话模型,采用生成式对话方法输出所述当前对话语句的回答语句,具体包括:
使用编码器对所述词向量序列进行进行编码得到隐状态;
使用解码器对所述隐状态进行解码得到输出序列,当所述输出序列的最后一个字符为停止符时停止解码;
将解码得到的所述输出序列和所述句子功能标签输入至所述生成式对话模型,采用生成式对话方法输出所述当前对话语句的所述回答语句。
可选的,所述隐状态的表达式如下:
ht=f(xt,ht-1);c=ht;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110200723.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钣金件直缝焊接和打磨装置及其方法
- 下一篇:一种调光膜及其制备方法