[发明专利]基于VGG16-SegUnet和dropout的海流机叶片附着物识别方法有效
申请号: | 201911132810.1 | 申请日: | 2019-11-19 |
公开(公告)号: | CN110863935B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 彭海洋;王天真 | 申请(专利权)人: | 上海海事大学 |
主分类号: | F03B11/00 | 分类号: | F03B11/00;F03B13/00;G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 上海互顺专利代理事务所(普通合伙) 31332 | 代理人: | 成秋丽 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 vgg16 segunet dropout 海流 叶片 附着物 识别 方法 | ||
1.一种基于VGG16-SegUnet和dropout的海流机叶片附着物识别方法,其特征在于,包括以下步骤:
步骤一、首先,采集不同附着类型的海流机水下图像,然后使用开源工具labelme进行语义标注,从而完成原始图像-语义标签数据集的创建:背景,叶片,附着物分别被标注为0,1,2;
步骤二、采用[0°,360°]的旋转数据增强技术扩充原始图像-语义标签数据集,然后对原始图像进行标准化预处理:
其中,x表示海流机图像中R,G,B任意一个维度的数据;xmin,xmax分别表示x中的最小,最大像素值;x最终被标准化到[-1,1];
再将增强后的数据按3:1:1的比例划分为训练集、验证集和测试集;
步骤三、搭建VGG16-SegUnet新型语义分割网络:将VGG16前13层的卷积和最大池化模型设定为特征提取编码层并使用ImageNet预训练权重初始化这些卷积结构;解码层的结构与SegNet中的解码层相同,采用反最大池化进行特征恢复;编码层与解码层之间除前向连接外,还融合了Unet中的特征级联以及SegNet中的最大池化索引保留技术,并在中间位置插入了一个30%dropout层;Dropout的引入在缓解训练过拟合现象的同时,也提供了不同的概率分类结果;
步骤四、将预处理好的训练集图像数据输入至VGG16-SegUnet中,输出逐像素softmax概率分类结果:
其中,x(i)表示一张训练图像x中的第i个像素点;θ为softmax分类器的权重参数矩阵,且p(y(i)=l|x(i);θ)表示x(i)的预测结果y(i)为语义标签l的概率;N表示待语义标注的类别个数;exp(·)表示指数函数;hθ(x(i))为softmax预测结果向量;
然后,使用Adadelta优化器对整个网络进行全局训练,降低交叉熵损失直到训练次数达到设定的最大值,并记录最终的训练权重:
其中,Loss(θ)表示交叉熵损失函数;Ntrain表示训练数据的个数;Nn表示第n张图像的像素总个数;log(·)表示对数函数;1{·}是一个示性函数,当{·}内的表达式成立时,输出1,反之,输出0;
步骤五、将预处理好的测试集图像输入到载入了训练权重的VGG16-SegUnet中,输出语义分割图,完成对图像中背景、叶片、附着物位置和大小的识别,同时对识别结果的不确定度进行估计,具体实现过程如下:
i.将每张测试图像输入到融合有30%dropout的VGG16-SegUnet中,并重复进行50次测试,得到50个softmax概率分类结果,这里记为Test50;
ii.求取Test50的均值以及方差
iii.从中找出每个像素点的最大概率类别,然后通过可视化技术显示出语义分割图;最大概率类别对应的方差以图像的形式直观地显示出来,即为不确定度图像;
步骤六、最后,根据语义分割图计算出精确的附着物面积占比以及识别准确率指标MIoU:
其中,AAP为附着物面积占比;attachment,blade分别表示附着物和整个海流机叶片区域;Count(·)用于计算指定区域内的像素点个数;
其中,MIoU表示平均交并比;pij表示真实标签为i而被误识别为标签j的像素个数;pii表示真实标签为i且被识别为标签i的像素个数;pji表示真实标签为j而被误识别为标签i的像素个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911132810.1/1.html,转载请声明来源钻瓜专利网。