[发明专利]一种基于变分自编码器隐变量操纵的受控文本生成方法在审
| 申请号: | 202210101812.X | 申请日: | 2022-01-27 |
| 公开(公告)号: | CN114492332A | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 黄书剑;蒋庆男;戴新宇;张建兵;陈家骏 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/56 |
| 代理公司: | 苏州汇诚汇智专利代理事务所(普通合伙) 32623 | 代理人: | 莫英妍 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 编码器 变量 操纵 受控 文本 生成 方法 | ||
1.一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:包括以下步骤:
S1:训练一个用于文本生成的变分自编码器模型;
S2:计算变分自编码器的隐变量与生成文本的属性之间的关联;
S3:通过操纵变分自编码器的隐变量生成具有指定属性的文本。
2.根据权利要求1所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:所述S2中计算变分自编码器的隐变量与生成文本的属性之间的关联的具体流程如下:
S2.1:基于训练好的用于文本生成的变分自编码器模型采样一组隐变量以及隐变量对应的文本;
S2.2:为采样得到的文本计算一组文本属性;
S2.3:针对不同的文本属性采用不同的关联计算方式计算生成文本属性与隐变量之间的关联。
3.根据权利要求2所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:所述文本属性包括文本类别属性和文本数值属性。
4.根据权利要求3所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:所述变分自编码器隐空间中的一个区域对应文本一种类别属性的一个取值,并通过为每一个类别属性取值找到其对应的隐空间区域的方式建立隐变量和文本类别属性之间的关联。
5.根据权利要求2所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:对于每一个文本数值属性,变分自编码器的隐变量存在一个投影方向与之对应,隐变量在所述投影方向上的投影决定了生成文本的这一属性的值。
6.根据权利要求1所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:所述S3中通过操纵变分自编码器的隐变量生成具有指定属性的文本的具体流程如下:
S3.1:根据控制条件采样出一个满足条件的隐变量;
S3.2:将采样得到的隐变量输入到变分自编码器的解码器中生成满足控制条件的文本。
7.根据权利要求6所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:所述操纵变分自编码器的隐变量的过程是指根据控制条件采样满足条件的隐变量。
8.根据权利要求6所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:控制生成文本的属性时,针对文本的类别属性和文本的数值属性采用不同的控制方法。
9.根据权利要求8所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:生成具有指定类别属性的文本时,从控制条件即一个属性取值对应的区域中采样满足条件的隐变量,所述采样方法为带有置信度的拒绝采样算法。
10.根据权利要求8所述的一种基于变分自编码器隐变量操纵的受控文本生成方法,其特征在于:生成具有指定数值属性的文本时,先从先验分布中采样一个隐变量,然后沿所需控制的文本属性对应的方向移动采样得到的隐变量,使得移动后的隐变量在与所需控制的属性对应的方向上的投影满足控制条件即取得指定值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210101812.X/1.html,转载请声明来源钻瓜专利网。





