[发明专利]一种基于分块卷积神经网络的细粒度图像分类方法有效
| 申请号: | 202010738474.1 | 申请日: | 2020-07-28 |
| 公开(公告)号: | CN111860672B | 公开(公告)日: | 2021-03-16 |
| 发明(设计)人: | 马占宇;谢吉洋;杜若一;司中威 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分块 卷积 神经网络 细粒度 图像 分类 方法 | ||
1.一种基于分块卷积神经网络的细粒度图像分类方法,设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;其特征是:
该方法由以下步骤实现:
步骤一、对于第l个分块卷积层f(·;Ω(l)),获取其输入特征图为x(l);所述为卷积核参数,R表示实数,c(l)为输入特征图通道数,c(l+1)为输出特征图通道数,·表示函数的输入,和为每个卷积核的宽和高;表示维度为的实矩阵;
所述输入特征图为第l-1个分块卷积层的输出特征图,x(1)为模型输入,W(l)和H(l)为输入特征图的宽和高;
步骤二、当l=1时,设置m1=n1=1;当l>1时,通过下式计算输入特征图上的每行分块数ml和每列分块数nl:
式中,和分别为输入特征图x(l)的理论感受野的宽和高,且和为所述理论感受野在宽和高维度上的收缩因子,和分别为第l′层分块卷积层的卷积核在特征图的宽和高维度上的步长,为向上取整操作;
步骤三、根据步骤二中获得的输入特征图上每行每列分块数ml和nl,随机采样获得特征图分块的宽和高并且和均为正整数,
步骤四、根据步骤三获得的特征图分块的宽和高将输入的特征图x(l)分成ml×nl块,获得分块特征图集合
步骤五、采用步骤一中的卷积核参数Ω(l)分别对步骤四获得的所有进行卷积,获得对应卷积输出特征图
步骤六、将步骤五获得的卷积输出特征图按原位置进行拼接,获得分块卷积神经网络中的第l个卷积层的输出特征图
步骤七、对于L个分块卷积层,均按照步骤一至六进行操作,直至获得最后第L个分块卷积层的输出特征图x(L+1),将x(L+1)输入到全连接层中,获得细粒度图像分类的输出概率p∈Rn,n是类别数,实现细粒度图像的分类。
2.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:还包括步骤八,采用交叉熵LCE(t,p)和真实类别t对细粒度图像分类的输出概率p进行优化:
LCE(t,p)=-lnpt。
3.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:步骤二中,所述理论感受野的宽和高维度上的收缩因子的范围分别为:
4.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:采用下述步骤替换步骤二至步骤六,具体为:
步骤A、设定所述输出特征图上的每行每列分块数ml和nl,随机采样得到特征图分块的宽和高并且和均为正整数,
步骤B、在输入的特征图x(l)上按列每隔插入列全零列向量,按行每隔插入行全零行向量,和分别为卷积核在特征图宽和高维度上的步长,为向下取整操作,获得处理后的特征图
步骤C、采用步骤一获得的卷积核参数Ω(l)对直接进行卷积,获得卷积输出特征图
步骤D:按照步骤C中插入全零列向量和行向量的位置,将卷积输出特征图中插入的向量去除,去除的列标号为去除的行标号为获得分块卷积神经网络中的第l个卷积层的输出特征图
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010738474.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:班车路线规划的可视化方法、装置、设备及介质
- 下一篇:加强型地埋管道





