[发明专利]基于潜在空间编辑的文本风格转换方法有效
申请号: | 202110555718.7 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113343648B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 易盼;姜峰;王辉 | 申请(专利权)人: | 湖北大学 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/253;G06F18/214;G06N3/0455;G06N3/08 |
代理公司: | 武汉泰山北斗专利代理事务所(特殊普通合伙) 42250 | 代理人: | 程千慧 |
地址: | 430062 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 潜在 空间 编辑 文本 风格 转换 方法 | ||
1.基于潜在空间编辑的文本风格转换方法,其特征在于,包括以下步骤:
步骤1、获取一批带有正向或者负向情感标签y的不同风格的句子x作为样本集;
步骤2、从样本集中选取一部分没有使用过的样本数据,将句子x对应的编码输入Transformer编码器,得到样本对应的潜在表征空间映射z,将潜在空间表示z输入解码器得到重建后的句子x′;
步骤3、利用损失函数计算x′与x之间的损失值,计算损失值是否小于预设阈值,若是,则转到下一步,若否,则转到步骤2;
步骤4、输出训练好的Transformer编码器和解码器;
步骤5、从样本集中随机选取一部分样本,将样本和样本和样本对应的情感标签输入支持向量机,得到潜在表征空间的超平面,超平面用于将潜在表征空间内带有正向情感属性和负向情感属性的映射z分开,所述超平面的法向量为w=classifier.coef_[0],对法向量进行归一化得到归一化后的法向量n=w/w的二范数;
步骤5、将样本集中的样本输入步骤4得到的训练好的Transformer编码器,得到样本对应的潜在表征空间映射z;
步骤6、计算潜在表征空间映射z到超平面的距离
d=nTz;
步骤7、将步骤5得到的潜在表征空间映射z沿着法向量n朝超平面的对面侧进行移动,得到zedit,zedit=z+αn-dn,其中α为超参数,可根据需要进行设置,且需满足以下条件:样本的情感标签为正向情感时,α0,样本的情感标签为负向情感时,α0;
步骤8、将zedit输入步骤4得到的训练好的解码器,得到输入样本对应的转换后的文本。
2.根据权利要求1所述的基于潜在空间编辑的文本风格转换方法,其特征在于,所述损失函数为带有标签平滑的交叉熵损失函数。
3.根据权利要求1所述的基于潜在空间编辑的文本风格转换方法,其特征在于,所述Transformer编码器包括两层自注意力单元。
4.根据权利要求1所述的基于潜在空间编辑的文本风格转换方法,其特征在于,所述超参数α的绝对值范围为12-16。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北大学,未经湖北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110555718.7/1.html,转载请声明来源钻瓜专利网。