[发明专利]一种基于可变形卷积神经网络的红外图像物体识别方法在审
申请号: | 201810316553.6 | 申请日: | 2018-04-10 |
公开(公告)号: | CN108564025A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 肖立军;廖志伟;邹国惠;裴星宇;万新宇;李晨熙;韩玉龙;吴伟力;覃佳奎;姜媛 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司珠海供电局 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 可变形 池化 红外图像 物体识别 采样 目标检测和识别 非线性变形 反向传播 几何变换 几何形变 空间形变 目标函数 图像识别 兴趣区域 测试集 分类器 卷积核 训练集 形变 构建 建模 卷积 学习 架构 视觉 引入 网络 成功 | ||
1.一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,包括以下步骤:
S1:收集数据库样本并设定训练集与测试集,其中数据库样本采用COCO、PASCAL VOC并设定类别和每一个类别在分类器中的编码,构建训练集;
S2:搭建卷积神经网络架构,通过交迭若干个卷积层和池化层设置卷积神经网络的深度与宽度架构;
S3:在卷积层采用可变形卷积核进行采样,通过加入一个额外的卷积层来学习offset偏移量,共享输入特征图,然后把输入特征图和训练得到的offset偏移量共同作为可变形卷积层的输入层,此时可变形卷积层采样点发生偏移,再进行卷积;
S4:在池化层采用可变形兴趣区域进行池化操作,其中ROI被分为n*n个bin,被输入到一个额外的全连接层学习offset,然后通过一个可变形兴趣区域池化层使每个bin发生偏移;
S5:在卷积神经网络的最后一层加上softmax分类器并设置目标函数;
S6:设置学习率参数,采用后向传播算法,使用训练集训练卷积神经网络模型一次,使用的得到的训练后的模型去识别测试集数据,统计整体识别率;
S7:重复步骤S6,直到目标函数值完全收敛,识别率不再提高为止,此时网络参数训练完毕,得到可变形卷积神经网络模板,即红外图像物体识别系统;
S8:应用该系统进行红外图像识别。
2.根据权利要求1所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,步骤S1所述测试集为南方电网xx设备拍摄的变电站设备红外图像。
3.根据权利要求1所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,步骤S3所述训练得到的offset偏移量包括通过外加offset field来训练卷积窗口的形状,卷积窗口在offset field上滑动就呈现了卷积像素偏移的效果,达到采样点优化的效果,其中采样公式为
其中p0指特征图上的任意像素值,pn指在卷积核中位置相应的值,Δpn指卷积核发生的位移量。接着,网络按照不规则的偏移量(pn+Δpn)采样;又因为Δpn通常是不连续的,此处采用双线性插值,插出每个点的像素值。
4.根据权利要求3所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,所述offset field的大小与输入层图片大小一致。
5.根据权利要求1所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,步骤S4所述ROI被分为3*3个bin。
6.根据权利要求1所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,步骤S4所述池化操作中池化公式为
p0是ROI左上角的点,nij(i行,j列)是固定大小bin里的总像素数,同样采用双线性插值,插出每个点的像素值。
7.根据权利要求1所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,步骤S5所述目标函数为计算所得值与目标标签值的差的平方。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司珠海供电局,未经广东电网有限责任公司;广东电网有限责任公司珠海供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810316553.6/1.html,转载请声明来源钻瓜专利网。