[发明专利]一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法在审
| 申请号: | 202110092924.9 | 申请日: | 2021-01-25 |
| 公开(公告)号: | CN112800927A | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 张培杰;张婷;刘兆英;李玉鑑 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 am softmax 损失 蝴蝶 图像 细粒度 识别 方法 | ||
1.一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法,其特征在于:包括以下步骤:
步骤1:预处理蝴蝶图像细粒度识别数据集,构建的334类共N幅蝴蝶图像的数据集D上面进行验证,将每一种类的数据集以8:2的比例划分为训练和测试图像,最终得到训练集Dt和测试集Ds,整个蝴蝶图像数据集表示为D={(Ii,yi)},1≤i≤N,其中Ii表示蝴蝶图像,yi表示类别标签;
步骤2:构建基础网络,选择VGG-16的前13层作为基础网络,该基础网络由5个卷积块组成,其中前两个卷积块包含两个卷积层和一个池化层,后三个卷积块包含三个卷积层和一个池化层,其中每个卷积核大小都是3×3,采用最大池化的方式;基础网络的输入为彩色图像Ii∈Rh×w×3,其中h和w分别表示图像的高度和宽度,3表示图像的通道个数,网络的输出为多通道的特征;
步骤3:构建双线性网络模型,此网络包含A和B两个并行的分支,其中A分支用于提取细粒度特征,B分支用于定位区域,这两个分支都使用步骤2中的基础网络:
步骤4:建立网络的损失函数,使用AM-Softmax作为损失函数,表示为:
其中,f代表输出层的输入,是最后一个全连接层权值矩阵W的第yp列,yp代表第p个样本真实标签的序号,m通常是一个大于1的整数,s为缩放因子;
步骤5:网络训练:设置迭代次数、学习率超参数,使用随机梯度下降算法对网络参数进行迭代更新,保存最终的模型;
步骤6:网络测试:加载保存的模型,将测试集Ds输入网络中,获得最终的分类准确率。
2.根据权利要求1所述的一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法,其特征在于:步骤3包括以下步骤:
步骤3.1:对于第p幅训练图像Ip∈Rh×w×3,1≤p≤Nt,双线性网络首先分别使用A和B两个分支提取特征,得到两个维度相同的特征和
步骤3.2:将特征和分别拉伸成一个向量,表示为:
其中,vector(·)表示向量化操作;
步骤3.3:使用外积操作对和进行特征融合,表示为:
其中,bip表示第p幅图像Ip融合后的特征;
步骤3.4:将bip拉伸为向量,得到第p幅图像Ip的双线性特征:
Bip=vector(bip)
其中,vector(·)表示向量化操作;
步骤3.5:将获取到的双线性特征做如下标准化计算:
其中,zp表示第p幅图像Ip归一化后的双线性特征;
步骤3.6:使用softmax分类器对归一化后的双线性特征zp进行分类,得到输出结果op∈R1×C,表示为:
其中C代表图像类别的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110092924.9/1.html,转载请声明来源钻瓜专利网。





