[发明专利]自然语言文本生成方法和装置以及对话系统在审
申请号: | 201911036989.0 | 申请日: | 2019-10-29 |
公开(公告)号: | CN112800737A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 王娟;程建波;彭南博;黄志翔 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06N3/08;G06N3/04;G06F16/332;G06F16/338 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 许蓓 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 文本 生成 方法 装置 以及 对话 系统 | ||
1.一种自然语言文本生成方法,其特征在于,包括:
获取待生成的结构化数据,所述结构化数据包括意图,或者,所述结构化数据包括意图、槽及其值;
将所述结构化数据输入自然语言文本生成模型并输出相应的文本句式,所述自然语言文本生成模型是利用结构化数据训练样本及其对应的文本模板对循环神经网络进行训练得到的;
如果所述结构化数据包括槽及其值,将所述文本句式中的槽的占位符替换为所述结构化数据中相应槽的值,得到相应的自然语言文本;
如果所述结构化数据不包括槽及其值,将所述文本句式作为相应的自然语言文本。
2.根据权利要求1所述的自然语言文本生成方法,其特征在于,
所述将所述结构化数据输入自然语言文本生成模型并输出相应的文本句式包括:
将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分,每个输出部分包括预测的多个文本节点;
根据各个输出部分中的文本节点的组合,确定所述结构化数据对应的多个文本句式。
3.根据权利要求2所述的自然语言文本生成方法,其特征在于,
所述根据各个输出部分中的文本节点的组合,确定所述结构化数据对应的多个文本句式包括:
从每个输出部分选取预测概率最大的预设数量的文本节点,所述预设数量为多个;
将各个输出部分中选取出来的一个文本节点进行组合;
从多个文本节点组合中选取所述预设数量的文本节点组合作为所述结构化数据对应的多个文本句式。
4.根据权利要求2所述的自然语言文本生成方法,其特征在于,
所述将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分包括:
所述将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分,其中,每个输出部分作为预测下个输出部分的输入。
5.根据权利要求1所述的自然语言文本生成方法,其特征在于,
所述结构化数据和所述结构化数据训练样本是经过独热编码的。
6.根据权利要求1所述的自然语言文本生成方法,其特征在于,
所述自然语言文本生成模型的训练过程包括:
根据所述自然语言文本生成模型的各个输出部分中的预测词与所述文本模板中相应部分的实际词之间的损失,确定总损失;
基于所述总损失计算的梯度满足预设条件时,所述循环神经网络训练完成,训练完成的所述循环神经网络作为所述自然语言文本生成模型。
7.根据权利要求1所述的自然语言文本生成方法,其特征在于,还包括:
获取对话系统基于用户请求生成的回复的结构化数据;
利用所述自然语言文本生成方法,将所述对话系统生成的回复的结构化数据转换成相应的自然语言文本,并输出。
8.一种自然语言文本生成装置,其特征在于,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行权利要求1-7中任一项所述的自然语言文本生成方法。
9.一种对话系统,其特征在于,包括:
结构化数据生成装置,被配置为基于用户请求生成回复的结构化数据;
以及
权利要求8所述的自然语言文本生成装置,被配置为将回复的结构化数据转换成相应的自然语言文本,并输出。
10.一种非瞬时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-7中任一项所述的自然语言文本生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911036989.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空调器及其控制方法
- 下一篇:自动驾驶车辆的控制方法、装置、设备及存储介质