[发明专利]基于对抗解耦的个性化手写文字生成方法有效
| 申请号: | 202210392274.4 | 申请日: | 2022-04-15 |
| 公开(公告)号: | CN114495118B | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 黄双萍;王庆丰;代港 | 申请(专利权)人: | 华南理工大学;人工智能与数字经济广东省实验室(广州) |
| 主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06T11/20 |
| 代理公司: | 东莞卓诚专利代理事务所(普通合伙) 44754 | 代理人: | 朱鹏 |
| 地址: | 510000 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 对抗 个性化 手写 文字 生成 方法 | ||
1.基于对抗解耦的个性化手写文字生成方法,其特征在于,包括以下步骤:
步骤1,构建风格向量提取器和内容分类器;
步骤2,以所述的风格向量提取器为生成器,以所述的内容分类器为判别器,进行生成对抗学习;
步骤3,将手写文字图片输入学习后的风格向量提取器,获得手写风格向量;
步骤4,将待生成的目标文字通过内容嵌入层映射为内容向量;
步骤5,拼接所述的手写风格向量和所述的内容向量,然后再融合初始序列,获得解码向量,即,其中代表在第二维上拼接,初始序列为:在训练时为手写文字图片对应的真实轨迹序列,在测试时为解码器预测的轨迹序列;
步骤6,将所述的解码向量输入解码器进行解码,获得具有手写风格的目标文字的轨迹预测序列。
2.根据权利要求1所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,步骤2中所述的对抗学习的过程为:交叉多轮训练判别器和生成器;每轮训练过程中,判别器的训练频次大于生成器的训练频次;训练判别器的时候仅更新判别器的参数,训练生成器的时候更新除判别器以外的模型的参数。
3.根据权利要求2所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,步骤2中所述的对抗学习的过程中,所述的生成器的损失函数为:
其中,表示坐标损失函数,表示坐标损失函数,表示状态损失函数,表示判别器损失函数,表示判别器损失函数的权重;
所述的坐标损失函数的计算公式为:
其中,表示文字对应的轨迹序列的真实x坐标,表示解码器预测轨迹序列的x坐标,n表示序列点长度,表示绝对值;
所述的坐标损失函数的计算公式为:
其中,表示文字对应的轨迹序列的真实y坐标,表示解码器预测轨迹序列的y坐标;
所述的状态损失函数的计算公式为:
其中,为第i个真实状态标签的onehot编码,为解码器输出的经过softmax的第i个概率值,k=3,表示三个状态,每个轨迹点对应三个状态为:下笔、抬笔、起笔;
所述的判别器损失函数的计算公式为:
其中,为第i个真实内容标签的onehot编码,为判别器输出的经过softmax的第i个概率值;
所述的判别器损失函数的权重的计算公式为:
其中,,,为当前训练轮次。
4.根据权利要求1所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,所述的风格向量提取器的结构为M1层CNN网络和N1层全连接层构成,所述的风格向量提取器的输出为(Batchsize,128)大小的风格向量,其中,M1和N1分别表示CNN网络和全连接层的层数,Batchsize表示一次训练所抓取的数据样本数量。
5.根据权利要求4所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,M1取值为7,N1取值为2。
6.根据权利要求4或5所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,所述的风格向量提取器为经过预训练的风格向量提取器,预训练采用的数据集为Casia1.1数据集,预训练过程中采用风格分类任务训练,所述的风格向量提取器的最后一层全连接层的数量根据手写风格的类别数量而确定。
7.根据权利要求1所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,所述的内容分类器的结构为M2层CNN网络和N2层全连接层构成,所述的内容分类器的任务为文字分类,即判别输入的手写文字是哪个字,其中M2和N2分别为CNN网络和全连接层的层数。
8.根据权利要求7所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,M2取值为6,N2取值为1。
9.根据权利要求8所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,所述的解码器的结构为5层LSTM网络。
10.根据权利要求1所述的基于对抗解耦的个性化手写文字生成方法,其特征在于,所述的轨迹预测序列指的是输出的手写文字的相对坐标序列,所述的相对坐标序列包括x、y坐标,以及每个点对应的状态,所述的状态包括下笔状态、起笔状态和抬笔状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;人工智能与数字经济广东省实验室(广州),未经华南理工大学;人工智能与数字经济广东省实验室(广州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210392274.4/1.html,转载请声明来源钻瓜专利网。





