[发明专利]一种多风格字体生成方法在审
申请号: | 202111111186.4 | 申请日: | 2021-09-23 |
公开(公告)号: | CN113837366A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 徐向纮;李金金 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/68 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 风格 字体 生成 方法 | ||
1.一种基于StarGAN 改进的多种风格字体生成方法,其特征是,包括以下步骤:
步骤一:构建数据集,源字体数据集和目标字体数据集准备,并对每个数据集制定目标域标签;
步骤二:构建生成对抗式网络,采用Attention U-NET和DenseNet两种特殊结构相结合作为生成器,判别器采用训练构并添加一个辅助分类器来提高GAN的性能,同时输出真假和类别;
步骤三:构建模型的损失函数,利用印刷体字体图片、目标字体图片数据集依次输入到基于StarGAN改进的网络训练模型中,对模型进行训练、优化和调参,得到符合要求的多风格字体生成网络;
步骤四:将完整的印刷字体图片与目标域标签结合输入到训练后的生成网络中,由训练后的网络模型输出GB2312字库中相对应完整的目标字体;
步骤五:对生成的目标字体图片进行质量评估,构建模型评级体系。
2.根据权利要求1所述的基于StarGAN 改进的多种风格字体生成方法,其特征在于,选取最常用的印刷体作为源字体,通过PC端自带的汉字字体文件数据ttf,采用PIL(PythonImage Library)来生成字体图片,根据收集到的常用汉字来批量的提取照片,选取中文手写数据库中的手写汉字图像和一些常见的网络艺术字体构成目标字体数据集,取最常用的670个汉字,并且将数据集中的字体图片大小调整为255*255;在步骤4中,将完整的印刷字体图片输入到训练好的网络模型中,即可得到GB2312中完整的6763个目标风格字体。
3.根据权利要求1所述的基于StarGAN 改进的多种风格字体生成方法,其特征在于,采用Attention U-Net和DenseNet相结合的结构作为生成器,首先在U-Net模型的编码部分引入DenseNet网络结构,在借鉴跳跃连接的基础上建立不同层之间的连接关系,降低特征提取时的网络参数复杂度,将归一化后源字体图像经过编码器,由卷积核为3×3四部分Denseblock提取相关字体特征,其中密集连接层的激活函数均采用修正线性单元ReLU,接着将每层的前后特征层特征图进行合并并重复利用,密集连接层后均有一层平移不变性的2×2最大下采样层(max pooling)以整合Dense block提取的字体特征;其次,在解码部分引入软注意模型,Attention U-NET是一种带有Soft Attention的U-Net结构,通过深层feature监督浅层feature实现Attention机制,为捕获足够多的字体特征图信息,在卷积神经网络体系中对特征映射网络进行上采样,Attention Gate添加到跳跃连接中,并且输出在上采样中添加到特征图,因此,Attention Gate的输入之一是跳跃连接中的输入,为相应层中下采样的特征图,而另一个输入是上采样中的上一层的特征图,Attention Gate模型在不相关的背景区中会逐渐抑制特征响应,而不需要在网络之间裁剪感兴趣区域(ROI),进而降低算法的计算复杂度,解决传统U-Net卷积网络对特征图“注意力分散”的现象,所述判别器网络由6层卷积网络和2层全连接层网络组成,每一层卷积网络包含一个卷积层和一个Leaky-Relu激活函数,2个全连接层网络一个用于判断生成字体图片的真假性,另一个用于对字体图像的风格进行分类,使判别器同时具有判断和分类的功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111111186.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种设施枇杷防极端低温冻害并促早成熟的方法
- 下一篇:一种折叠式画架