[发明专利]训练对抗网络模型的方法、建立字库的方法、装置和设备有效
申请号: | 202110487527.1 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113140017B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 刘家铭;唐礼承;洪智滨 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06T11/20;G06N3/0475;G06N3/045 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 范芳茗 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 对抗 网络 模型 方法 建立 字库 装置 设备 | ||
1.一种训练对抗网络模型的方法,所述对抗网络模型包括生成模型和判别模型,所述方法包括:
使用所述生成模型,基于具有基础字体的内容字样本和具有风格字体的风格字样本来产生生成字,并基于所述内容字样本来产生重构字;
利用所述判别模型,基于所述生成字和所述重构字,来计算生成模型的基本损失;所述基本损失是根据所述生成字与风格字样本之间的字体风格差异以及所述重构字与所述内容字样本之间的差异确定的;
通过使用经训练的字符分类模型对所述生成字进行分类,来计算生成模型的字符损失;
基于所述基本损失和所述字符损失来调整所述生成模型的参数;
其中,所述生成模型包括内容编码器、风格编码器和解码器;
产生生成字包括:使用内容编码器从内容字样本提取内容特征,使用风格编码器从风格字样本提取风格字体风格特征,以及使用解码器基于所述内容特征和所述风格字体风格特征来产生所述生成字;
产生重构字包括:使用内容编码器从内容字样本提取内容特征,使用风格编码器从内容字样本提取基础字体风格特征,以及使用解码器基于所述内容特征和所述基础字体风格特征来产生所述重构字。
2.根据权利要求1所述的方法,其中,所述内容字样本与基于所述内容字样本产生的生成字具有相同的内容标签,计算生成模型的字符损失包括:
使用所述字符分类模型对所述生成字进行分类,以确定生成字的内容;
基于所述字符分类模型确定的生成字的内容与所述生成字的内容标签之间的差异,来计算字符损失。
3.根据权利要求1或2所述的方法,其中,所述计算基本损失包括:
通过使用所述生成字和所述风格字样本对所述判别模型进行训练,来计算生成模型的对抗损失;
基于重构字与内容字样本之间的差异来计算生成模型的重构损失;
基于所述对抗损失和所述重构损失来计算生成模型的基本损失。
4.根据权利要求3所述的方法,其中,所述基于所述基本损失和所述字符损失来调整所述生成模型的参数包括:
基于以下等式来计算生成模型的总损失L:
L=λGANLGAN+λRLR+λCLC
LR=[|x-G(x,{x})|]
其中LGAN表示对抗损失,LR表示重构损失,LC表示字符损失,λGAN、λR和λC分别表示对抗损失、重构损失和字符损失的权重,x表示内容字样本,y表示风格字样本,E表示期望算子,表示生成字,D()表示判别模型的输出,G(x,{x})表示生成模型基于内容字样本x生成的重构字,表示字符分类模型确定的生成字的内容类别与该生成字的内容标签一致的概率;
基于所述总损失来调整所述生成模型的参数。
5.根据权利要求2所述的方法,其中,所述内容字样本与基于所述内容字样本产生的重构字具有相同的内容标签,计算生成模型的字符损失还包括:
使用所述字符分类模型对所述重构字进行分类,以确定重构字的内容;
基于所述字符分类模型确定的重构字的内容与所述重构字的内容标签之间的差异,来计算附加字符损失;以及
将所述附加字符损失添加到所述字符损失中。
6.根据权利要求1所述的方法,其中,所述经训练的字符分类模型是通过对ResNet18神经网络进行训练得到的字符分类模型。
7.根据权利要求1所述的方法,还包括:在调整所述生成模型的参数之后,响应于所述调整的总次数小于预设次数,针对至少另一个内容字样本和至少另一个风格字样本返回执行产生生成字和产生重构字的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487527.1/1.html,转载请声明来源钻瓜专利网。