[发明专利]一种基于分块卷积神经网络的细粒度图像分类方法有效

申请号：	202010738474.1	申请日：	2020-07-28
公开（公告）号：	CN111860672B	公开（公告）日：	2021-03-16
发明（设计）人：	马占宇;谢吉洋;杜若一;司中威	申请（专利权）人：	北京邮电大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	北京挺立专利事务所(普通合伙) 11265	代理人：	高福勇
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于分块卷积神经网络细粒度图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于分块卷积神经网络的细粒度图像分类方法，设定分块卷积神经网络共有L个分块卷积层，l为当前分块卷积层的层数，1≤l≤L，初始化为l＝1；其特征是：

该方法由以下步骤实现：

步骤一、对于第l个分块卷积层f(·；Ω^(l))，获取其输入特征图为x^(l)；所述为卷积核参数，R表示实数，c^(l)为输入特征图通道数，c^(l+1)为输出特征图通道数，·表示函数的输入，和为每个卷积核的宽和高；表示维度为的实矩阵；

所述输入特征图为第l-1个分块卷积层的输出特征图，x⁽¹⁾为模型输入，W^(l)和H^(l)为输入特征图的宽和高；

步骤二、当l＝1时，设置m₁＝n₁＝1；当l＞1时，通过下式计算输入特征图上的每行分块数m_l和每列分块数n_l：

式中，和分别为输入特征图x^(l)的理论感受野的宽和高，且和为所述理论感受野在宽和高维度上的收缩因子，和分别为第l′层分块卷积层的卷积核在特征图的宽和高维度上的步长，为向上取整操作；

步骤三、根据步骤二中获得的输入特征图上每行每列分块数m_l和n_l，随机采样获得特征图分块的宽和高并且和均为正整数，

步骤四、根据步骤三获得的特征图分块的宽和高将输入的特征图x^(l)分成m_l×n_l块，获得分块特征图集合

步骤五、采用步骤一中的卷积核参数Ω^(l)分别对步骤四获得的所有进行卷积，获得对应卷积输出特征图

步骤六、将步骤五获得的卷积输出特征图按原位置进行拼接，获得分块卷积神经网络中的第l个卷积层的输出特征图

步骤七、对于L个分块卷积层，均按照步骤一至六进行操作，直至获得最后第L个分块卷积层的输出特征图x^(L+1)，将x^(L+1)输入到全连接层中，获得细粒度图像分类的输出概率p∈Rⁿ，n是类别数，实现细粒度图像的分类。

2.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法，其特征在于：还包括步骤八，采用交叉熵L_CE(t，p)和真实类别t对细粒度图像分类的输出概率p进行优化：

L_CE(t，p)＝-lnp_t。

3.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法，其特征在于：步骤二中，所述理论感受野的宽和高维度上的收缩因子的范围分别为：

4.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法，其特征在于：采用下述步骤替换步骤二至步骤六，具体为：

步骤A、设定所述输出特征图上的每行每列分块数m_l和n_l，随机采样得到特征图分块的宽和高并且和均为正整数，

步骤B、在输入的特征图x^(l)上按列每隔插入列全零列向量，按行每隔插入行全零行向量，和分别为卷积核在特征图宽和高维度上的步长，为向下取整操作，获得处理后的特征图

步骤C、采用步骤一获得的卷积核参数Ω^(l)对直接进行卷积，获得卷积输出特征图

步骤D：按照步骤C中插入全零列向量和行向量的位置，将卷积输出特征图中插入的向量去除，去除的列标号为去除的行标号为获得分块卷积神经网络中的第l个卷积层的输出特征图

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010738474.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载