[发明专利]基于HRED和内外记忆网络单元的情感对话生成方法在审
申请号: | 201810186491.1 | 申请日: | 2018-03-07 |
公开(公告)号: | CN108563628A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 卓汉逵;纪登林 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06K9/62;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 记忆网络 对话 循环神经网络 记忆单元 模型生成 情感表达 情感信息 情感因素 生成模型 显式表达 语法表达 自动均衡 多轮 构建 语料 嵌入 聊天 外部 应用 | ||
1.一种基于HRED和内外记忆网络单元的情感对话生成方法,其特征在于,包括以下步骤:
S1:准备情感对话系统数据;
S2:对于S1得到的数据集若是单轮对话,利用该单轮对话数据集对编码-解码模型进行训练,其中在解码模块中添加预先训练的情感类别的词向量以及内外记忆单元,模型训练完毕后进行测试;
S3:对于S1中得到的数据集若是多轮对话,利用该多轮对话数据集采用层次循环神经网络模型进行训练,将每轮对话的中间上下文向量与该轮对话的情感向量拼接作为输入另构建一层循环神经网络,模型训练完毕后进行测试,给定一句话和接下来两句话的情感标签,可以生成接下来两轮对话的语句。
2.根据权利要求1所述的基于HRED和内外记忆网络单元的情感对话生成方法,其特征在于,所述步骤S1中训练文本情感分类器的模型对比基于词汇的情感分析,选择Bi-LSTM模型,该模型在测试集上的准确率为0.623。
3.根据权利要求2所述的基于HRED和内外记忆网络单元的情感对话生成方法,其特征在于,所述步骤S2中情感类别的词向量是经过单独训练的,解码阶段是原始输入与情感向量和上下文向量进行拼接作为新的输入,如果情感向量是静态不变的那么在语句生成的过程中为了考虑情感的影响会导致输出产生比较严重的语法错误,采用一个内部记忆网络模块来捕获情感的动态变化,情感状态将会随着语句的生成逐渐减弱,当语句生成完成时情感状态的值将会衰减到0,依靠内部记忆模块无法显示情感状态与当前步所选词汇之间的关系,通过构建了一个外部记忆模块,通过训练出不同的情感词和非情感词的生成概率分布来显式的表达情感。
4.根据权利要求3所述的基于HRED和内外记忆网络单元的情感对话生成方法,其特征在于,所述步骤S3中多轮对话与单轮对话的区别在于对于人类对话而言,不只考虑当前对话的问题还考虑前几轮对话对当前对话的影响,而每轮对话编码完之后会生成一个上下文向量,将每轮对话的上下文向量作为一个新的上下文循环神经网络的输入,使得后面的对话会考虑到前面几轮对话的信息,将情感向量与上下文向量进行拼接将前几轮对话的情感状态信息传递给后面的对话。
5.根据权利要求4所述的基于HRED和内外记忆网络单元的情感对话生成方法,其特征在于,所述步骤S1中,使用NLPCC数据集训练一个文本情感分类器,并使用训练出来的分类器对智能客服聊天数据集进行自动标注构建所需要的多轮情感对话数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810186491.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:启发式语音交互方法及装置
- 下一篇:一种日志解析规则自动生成方法和装置