[发明专利]一种基于旋转不变卷积神经网络的书法字风格分类方法有效
| 申请号: | 202010386734.3 | 申请日: | 2020-05-09 |
| 公开(公告)号: | CN111709443B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 张九龙;于文航;屈小娥 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06V30/22 | 分类号: | G06V30/22;G06V30/19;G06V10/82;G06N3/0464;G06N3/047;G06N3/048;G06N3/084 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 燕肇琪 |
| 地址: | 710048 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 旋转 不变 卷积 神经网络 书法 风格 分类 方法 | ||
1.一种基于旋转不变卷积神经网络的书法字风格分类方法,其特征在于,包括以下步骤:
步骤1,建立取样样本并预处理数据集;
步骤2,划分数据集为训练样本集和测试样本集,并对训练集样本进行数据扩充作为新的训练集;
步骤3,对于步骤2得到的训练集中的每一张训练样本,提取16个副本图像,并将他们一一对应输入到完全相同的16个卷积架构中处理,将处理后得到的16个特征图串连接起来,输入到卷积架构后面的3个串联的全连接层中,得到该训练样本的分类结果;
步骤4,将步骤3得到的分类结果带入到交叉熵损失函数中,计算出本次训练产生的损失,然后求出损失函数关于网络中权值参数的梯度,引入Nesterov动量后使用梯度下降算法不断更新模型的权值参数,使损失函数达到全局最小值,从而得到训练好的网络模型;
步骤5,将待分类测试样本集输入到步骤4训练好的模型中进行书法字风格分类,得到分类准确率。
2.根据权利要求1所述的一种基于旋转不变卷积神经网络的书法字风格分类方法,其特征在于,步骤1的具体操作为:
步骤1.1,用最小边框算法从整幅图像中获取单个书法字符;
步骤1.2,将得到的不同书法风格的每张图像按其中心对齐,并将它们裁剪成相同的大小64×64×3,得到取样样本。
3.根据权利要求2所述的一种基于旋转不变卷积神经网络的书法字风格分类方法,其特征在于,步骤2的具体操作为:
步骤2.1,对步骤1获得的取样样本以3:1的比例随机分成训练样本集和测试样本集;
步骤2.2,对训练样本集进行数据扩充操作:即通过随机扰动图像来扩展训练样本集,每个训练样本集都以五种方式进行随机扰动,这五种数据扩充的方式为旋转、平移、缩放、翻转以及图像增亮。
4.根据权利要求3所述的一种基于旋转不变卷积神经网络的书法字风格分类方法,其特征在于,步骤2中,五种数据扩充的方式:旋转、平移、缩放、翻转以及图像增白的具体要求如下:
旋转:随机旋转一个角度,该角度为在0°到360°之间均匀采样;
平移:在x和y方向上移动,移动的距离在-4到4个像素之间均匀采样;移动的大小是有限的,以确保感兴趣的对象仍然在图像的中心;
缩放:使用缩放因子随机缩放,随机因子在0.9到1.1之间均匀采样;
翻转:图像以0.5的概率随机翻转;
增亮:使用PCA来改变RGB通道的强度,即给每个像素加上[P1,P2,P3][a1λ1,α2λ2,α3λ3];
Pi和λi是3×3RGB像素值协方差矩阵的第i个特征向量和特征值,αi为从均值为0,标准差为0.1的高斯分布中抽取的随机变量,i=1,2,3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010386734.3/1.html,转载请声明来源钻瓜专利网。





