[发明专利]一种视频SAR车辆目标检测方法有效
| 申请号: | 202010653444.0 | 申请日: | 2020-07-08 |
| 公开(公告)号: | CN111798490B | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 黄理杰;钱江 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04;G06N3/08 |
| 代理公司: | 重庆航图知识产权代理事务所(普通合伙) 50247 | 代理人: | 胡小龙 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 sar 车辆 目标 检测 方法 | ||
1.一种视频SAR车辆目标检测方法,其特征在于:包括以下步骤:
构建具有3D卷积层的卷积神经网络;
对3D卷积层的卷积神经网络进行训练神经网络;
用训练好的神经网络检测视频SAR中的车辆目标;
根据置信度和预测框的重叠度选取最终的检测目标;
所述3D卷积层的卷积神经网络是使用tensorflow框架搭建形成的卷积神经网络,所述卷积神经网络的输入端用于接收连续多帧图像组成的输入张量,所述卷积神经网络的输出端为包含目标检测信息的输出张量;
所述卷积神经网络包括CBL2D模块、CBL3D模块、CONV3D模块、res2D模块、res3D模块、ReduceSum模块、sigmoid模块、concat模块;
所述输入张量依次经过若干个CBL3D模块、res3D模块、ReduceSum模块、res2D模块、CBL2D模块、CONV3D模块后得到若干单通道张量,最后分别通过sigmoid模块,再由concat模块将若干单通道张量合成多通道的输出张量;
所述输出张量包括第1通道、第2通道、第3通道、第4通道、第5通道,所述各通道按照以下方式设置;
所述第1通道表示某一单元格内有待检测目标的置信度C,0≤C≤1,C的数值越大表示此单元格内有待检测目标的概率越大;如果某个单元格内有待检测目标,则第2到第5通道的4个数值分别按照以下公式计算:
第2通道:目标框中心相在单元格内的局部横坐标x
当dX=0时x=0,目标框中心位于单元格左边缘,当dX=wc时x=1,目标框中心位于单元格右边缘;
第3通道:目标框中心相在单元格内的局部纵坐标y
当dY=0时y=0,目标框中心位于单元格上边缘,当dY=hc时y=1,目标框中心位于单元格下边缘;
第4通道:目标框的宽度占整幅图像宽度的比例w
第5通道:目标框的高度占整幅图像高度的比例h
所述目标框中心坐标(X,Y)由目标框中心在单元格内的局部坐标(x,y)、单元格的宽高、单元格的列编号col和行编号row按照以下公式计算得到:
X=(col+x)wc
Y=(row+y)hc。
2.如权利要求1所述的方法,其特征在于:所述CBL2D模块包括依次连接组成的二维卷积层conv2D、批量归一化层BatchNorm、激活函数层LeakyRelu;
所述CBL3D模块包括依次连接组成的三维卷积层conv3D、批量归一化层BatchNorm、激活函数层LeakyRelu;
所述res2D模块为残差模块,所述res2D残差模块的输入经过两次二维卷积后和输入相加得到输出;
所述res3D为残差模块,所述res2D残差模块的输入经过两次三维卷积后和输入相加得到输出;
所述CONV3D模块为三维卷积层,所述CONV3D模块依次通过维度扩展层ExpandDims层、三维卷积层conv3D、降维求和层ReduceSum得到输出。
3.如权利要求2所述的方法,其特征在于:所述输入张量中的各帧图像划分为若干个单元格,所述单元格中设置有目标框,所述目标框用于确定目标在单元格中的位置和目标框的高度占整幅图像高度的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010653444.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种履带挖掘机用履带护罩
- 下一篇:一种基于区块链和大数据的金融数据预测系统





