[发明专利]更新句子生成模型的方法以及句子生成设备在审
申请号: | 201810478297.0 | 申请日: | 2018-05-18 |
公开(公告)号: | CN109670147A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 李镐式;罗辉栋 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F17/20 | 分类号: | G06F17/20;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 姜长星;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码模型 句子生成 句子 奖励信息 目标句子 更新 设备提供 重新设置 权重 关联 配置 | ||
1.一种更新句子生成模型的方法,包括:
使用第一解码模型生成与源句子对应的目标句子;
使用第二解码模型,计算与目标句子相关联的奖励信息,其中,第二解码模型被配置为以与由第一解码模型生成的句子的次序不同的次序生成句子;
基于计算的奖励信息,重新设置第一解码模型中的每个节点的权重。
2.根据权利要求1所述的方法,其中,计算奖励信息的步骤包括:
基于从第二解码模型生成包括在目标句子中的每个词的概率,来计算奖励信息。
3.根据权利要求2所述的方法,其中,计算奖励信息的步骤还包括:
使用源句子和在先前时间从第二解码模型输出的第一词,计算在当前时间从第二解码模型生成第二词的概率。
4.根据权利要求2所述的方法,其中,计算奖励信息的步骤包括:
使用包括在目标句子中的词以与目标句子中的所述词的次序不同的次序排列的序列,来计算奖励信息。
5.根据权利要求1所述的方法,其中,第一解码模型是包括循环神经网络的前向解码模型,
第二解码模型是包括循环神经网络的后向解码模型。
6.根据权利要求1所述的方法,其中,重新设置权重的步骤包括:
使用第一解码模型,计算与目标句子相关联的策略信息;
使用计算的策略信息和计算的奖励信息,重新设置与预设条件对应的权重。
7.根据权利要求6所述的方法,其中,计算策略信息的步骤包括:
基于从第一解码模型生成包括在目标句子中的每个词的概率,来计算策略信息。
8.根据权利要求7所述的方法,其中,计算策略信息的步骤还包括:
使用源句子和在先前时间从第一解码模型输出的第一词,计算在当前时间从第一解码模型生成第二词的概率。
9.根据权利要求6所述的方法,其中,计算权重的步骤包括:
重新设置权重使得由与多个目标句子中的每个目标句子相关联的奖励信息和策略信息定义的目标函数最大化,
其中,所述多个目标句子是使用第一解码模型从源句子生成的。
10.根据权利要求6所述的方法,其中,计算权重的步骤包括:
重新设置权重使得由目标函数和从第一解码模型生成源句子的预定正确句子的概率定义的损失函数最小化,
其中,多个目标句子是使用第一解码模型从源句子生成的,目标函数由与所述多个目标句子中的每个目标句子相关联的奖励信息和策略信息来定义。
11.根据权利要求1所述的方法,其中,生成目标句子的步骤包括:
基于响应于源句子而从第一解码模型输出的最终结果值之中的在预设范围内的最终结果值,生成多个目标句子。
12.根据权利要求1所述的方法,其中,生成目标句子的步骤包括:
基于响应于源句子中的词而在第一时间从第一解码模型输出的输出值,生成多个目标句子,
其中,计算奖励信息的步骤包括:
使用第二解码模型,计算与在第一时间生成的所述多个目标句子相关联的奖励信息。
13.根据权利要求1所述的方法,其中,生成目标句子的步骤包括:
通过对响应于源句子中的词而在第一时间从第一解码模型输出的输出值进行采样,来生成预设数量的目标句子,
其中,计算奖励信息的步骤包括:
使用第二解码模型,计算与所述预设数量的目标句子相关联的奖励信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810478297.0/1.html,转载请声明来源钻瓜专利网。