[发明专利]一种基于特征融合Alexnet壁画图像分类方法在审
申请号: | 201911025305.7 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110766083A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 曹建芳;崔红艳 | 申请(专利权)人: | 忻州师范学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 34147 合肥律众知识产权代理有限公司 | 代理人: | 赵娟 |
地址: | 034000 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 壁画 分类 壁画图像 数据集 卷积 随机性 卷积神经网络 模型技术领域 双通道结构 传统人工 模型提取 实验对比 特征融合 特征提取 网络参数 增强数据 充分性 连接层 网络层 准确率 池化 算法 验证 主观 | ||
1.一种基于特征融合Alexnet壁画图像分类方法,其特征在于,具体分类方法步骤如下:
(1)AlexNet模型的建立
所述AlexNet模型由5个卷积层和3个全连接层组成,且采用双通道结构,卷积层和池化层是模型提取特征的关键部分,卷积层是由m个卷积核组成的特征映射层,卷积操作公式如下:
池化层在卷积操作之后进行,池化操作公式如下:
(2)基于特征融合AlexNet壁画图像分类框架的建立
分类框架由一个3层双通道的特征融合层和一个3层的全连接层组成,具体建立方法如下:
S1输入层将原始图像以224×224×3的形式作为输入;
S2中间的堆叠层设置为具有相同层数和卷积核数量的两个通道channel1和channel2,分通道来提取图像抽象特征传递给分类器,Channel1的卷积核大小分别为11、5、3,Channel2的卷积核大小为11、3、5,各通道的卷积核数目分别为96、256、384,步长为4、1、1,每层池化核大小设置为3×3,步长为2;
S3同样采用三个全连接层,并在全连接处使用Dropout层;
(3)壁画分类流程
S1图像预处理
输入:样本集I;
step1:对于样本集中的每一张图片,进行缩放,水平垂直翻转变换,加噪和明暗度变换等预处理操作;
step2:得到扩展后的数据集;
step3:通过随机函数将扩展后的数据集图片划分为65%的训练集和35%的测试集;
输出:训练集E和测试集T;
S2模型训练
输入:训练集E;
step1:初始化权重值和偏置值等参数,设置学习率和的大小以及次数等超参数的数值;
step2:开始训练,对训练集中每个batch的每一张图片计算误差,反向反馈传播,更新参数值;
step3:重复step2,直到迭代次数满足停止条件,转到step4;
step4:得到训练好参数的网络模型;
输出:训练好的网络模型;
S3模型测试
输入:测试集T;
step1:将测试集中的所有样本输入到训练好的网络模型中进行预测。
step2:统计预测结果,得到分类准确率。
输出:分类准确率。
2.根据权利要求1所述的一种基于特征融合Alexnet壁画图像分类方法,其特征在于,所述卷积操作公式中代表输入层,代表输出层,Mj代表输入特征图的集合,W代表权重集合,代表权重值,b代表偏置集合,代表偏置值,fc代表激励函数。
3.根据权利要求1所述的一种基于特征融合Alexnet壁画图像分类方法,其特征在于,所述池化操作公式中fp表示池化操作,常用的有最大池化、均值池化和随机池化。
4.根据权利要求1所述的一种基于特征融合Alexnet壁画图像分类方法,其特征在于,操作计算机基于Windows10系统、拥有i7-8750的处理器型号和8G的内存容量,搭载NVIDIAGTX1060的GPU,采用Python语言编程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于忻州师范学院,未经忻州师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911025305.7/1.html,转载请声明来源钻瓜专利网。