[发明专利]一种基于分块卷积神经网络的细粒度图像分类方法有效

专利信息
申请号: 202010738474.1 申请日: 2020-07-28
公开(公告)号: CN111860672B 公开(公告)日: 2021-03-16
发明(设计)人: 马占宇;谢吉洋;杜若一;司中威 申请(专利权)人: 北京邮电大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 北京挺立专利事务所(普通合伙) 11265 代理人: 高福勇
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分块 卷积 神经网络 细粒度 图像 分类 方法
【权利要求书】:

1.一种基于分块卷积神经网络的细粒度图像分类方法,设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;其特征是:

该方法由以下步骤实现:

步骤一、对于第l个分块卷积层f(·;Ω(l)),获取其输入特征图为x(l);所述为卷积核参数,R表示实数,c(l)为输入特征图通道数,c(l+1)为输出特征图通道数,·表示函数的输入,和为每个卷积核的宽和高;表示维度为的实矩阵;

所述输入特征图为第l-1个分块卷积层的输出特征图,x(1)为模型输入,W(l)和H(l)为输入特征图的宽和高;

步骤二、当l=1时,设置m1=n1=1;当l>1时,通过下式计算输入特征图上的每行分块数ml和每列分块数nl

式中,和分别为输入特征图x(l)的理论感受野的宽和高,且和为所述理论感受野在宽和高维度上的收缩因子,和分别为第l′层分块卷积层的卷积核在特征图的宽和高维度上的步长,为向上取整操作;

步骤三、根据步骤二中获得的输入特征图上每行每列分块数ml和nl,随机采样获得特征图分块的宽和高并且和均为正整数,

步骤四、根据步骤三获得的特征图分块的宽和高将输入的特征图x(l)分成ml×nl块,获得分块特征图集合

步骤五、采用步骤一中的卷积核参数Ω(l)分别对步骤四获得的所有进行卷积,获得对应卷积输出特征图

步骤六、将步骤五获得的卷积输出特征图按原位置进行拼接,获得分块卷积神经网络中的第l个卷积层的输出特征图

步骤七、对于L个分块卷积层,均按照步骤一至六进行操作,直至获得最后第L个分块卷积层的输出特征图x(L+1),将x(L+1)输入到全连接层中,获得细粒度图像分类的输出概率p∈Rn,n是类别数,实现细粒度图像的分类。

2.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:还包括步骤八,采用交叉熵LCE(t,p)和真实类别t对细粒度图像分类的输出概率p进行优化:

LCE(t,p)=-lnpt

3.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:步骤二中,所述理论感受野的宽和高维度上的收缩因子的范围分别为:

4.根据权利要求1所述的一种基于分块卷积神经网络的细粒度图像分类方法,其特征在于:采用下述步骤替换步骤二至步骤六,具体为:

步骤A、设定所述输出特征图上的每行每列分块数ml和nl,随机采样得到特征图分块的宽和高并且和均为正整数,

步骤B、在输入的特征图x(l)上按列每隔插入列全零列向量,按行每隔插入行全零行向量,和分别为卷积核在特征图宽和高维度上的步长,为向下取整操作,获得处理后的特征图

步骤C、采用步骤一获得的卷积核参数Ω(l)对直接进行卷积,获得卷积输出特征图

步骤D:按照步骤C中插入全零列向量和行向量的位置,将卷积输出特征图中插入的向量去除,去除的列标号为去除的行标号为获得分块卷积神经网络中的第l个卷积层的输出特征图

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010738474.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top