[发明专利]一种多尺度特征提取融合配电网设备定位识别方法有效
申请号: | 202310160905.4 | 申请日: | 2023-02-24 |
公开(公告)号: | CN115830302B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 邓志祥;王文彬;范瑞祥;潘建兵;徐在德 | 申请(专利权)人: | 国网江西省电力有限公司电力科学研究院;国家电网有限公司;江西博微新技术有限公司 |
主分类号: | G06V10/24 | 分类号: | G06V10/24;G06V10/52;G06V10/764;G06V10/80;G06V10/82;G06N3/0464 |
代理公司: | 南昌丰择知识产权代理事务所(普通合伙) 36137 | 代理人: | 吴称生 |
地址: | 330096 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 尺度 特征 提取 融合 配电网 设备 定位 识别 方法 | ||
1.一种多尺度特征提取融合配电网设备定位识别方法,其特征是,包括如下步骤:
步骤S1、采集获取各种场景下配电网设备图像数据,并进行预处理,并划分训练集、验证集及测试集;
步骤S2、构建由多尺度Transformer特征提取主干网络、金字塔多尺度特征融合模块、分类检测预测层构成的目标检测网络;
所述多尺度Transformer特征提取主干网络由一个stem模块和四个特征提取阶段模块组成,四个特征提取阶段模块依次为第一特征提取阶段模块、第二特征提取阶段模块、第三特征提取阶段模块、第四特征提取阶段模块;
第一特征提取阶段模块依次包括Patch Embedding模块、Swin Transformer-Encoder模块和下采样层,Patch Embedding模块的输入为stem模块的输出,Swin Transformer-Encoder模块获取Patch Embedding模块的输出,Swin Transformer-Encoder模块处理后的特征经下采样层处理得到第一特征图M1;
第二特征提取阶段模块包括Swin Transformer-Encoder模块和下采样层;其SwinTransformer-Encoder模块的输入为第一特征提取阶段模块得到的第一特征图M1;
第三特征提取阶段模块包括Swin Transformer-Encoder模块和下采样层;其SwinTransformer-Encoder模块的输入为第二特征提取阶段模块得到的第二特征图M2;
第四特征提取阶段模块包括Swin Transformer-Encoder模块和下采样层;其SwinTransformer-Encoder模块的输入为第三特征提取阶段模块得到的第三特征图M3;第四特征提取阶段模块输出第四特征图M4;所述Swin Transformer-Encoder模块由两个连续的Swin Transformer Block所组成,依次经过归一化层后送入窗口自注意力机制,送入归一化层后输入给MLP模块;再经过归一化层后送入偏移窗口自注意力机制,送入归一化层后输入给MLP模块,其中在自注意力机制和MLP模块后均有残差链接;
所述金字塔多尺度特征融合模块将第一特征提取阶段模块输出的第一特征图M1和第二特征提取阶段模块输出的第二特征图M2融合得到第一次融合特征图M2′;第一次融合特征图M2′经下采样层后与第三特征提取阶段模块输出的第三特征图M3融合得到第二次融合特征图M3′;第二次融合特征图M3′经下采样层后与第四特征提取阶段模块输出的第四特征图M4融合得到第三次融合特征图M4′,第三次融合特征图M4′经下采样层后得到第五特征图M5;将第一次融合特征图M2′、第二次融合特征图M3′、第三次融合特征图M4′、第五特征图M5输入分类检测预测层;
分类检测预测层使用两个卷积层级联而成,输出分类结果及目标位置;
步骤S3、将训练集送入目标检测网络进行训练:由多尺度Transformer特征提取主干网络进行特征提取,金字塔多尺度特征融合模块进行尺度的融合,把得到的融合后特征图输入到分类检测预测层,分类检测预测层完成最后的预测框坐标及类别的输出,分析检测结果;在训练过程中对训练误差进行梯度下降,完成可训练的权重参数学习,得到训练完成的目标检测模型;
步骤S4、将验证集送入步骤S3训练完成的目标检测模型,进一步的估计泛化误差,调整模型的超参数;
步骤S5、使用超参数调整优化完成后的目标检测模型检测测试集,完成配电网设备识别和分类,评价测试结果,然后用测试合格的目标检测模型检测待测配电网设备图像。
2.根据权利要求1所述的多尺度特征提取融合配电网设备定位识别方法,其特征是,所述Patch Embedding模块将配电网设备图像裁成一个个“图像块”*“图像块”的窗口大小,然后进行嵌入,所述Patch Embedding模块包括一个下采样层和一个1×1卷积。
3.根据权利要求1所述的多尺度特征提取融合配电网设备定位识别方法,其特征是,所述stem模块实质为一个7×7的卷积层,步距为2。
4.根据权利要求1所述的多尺度特征提取融合配电网设备定位识别方法,其特征是,所述下采样层均为卷积核大小为1×1,步距为2的卷积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司电力科学研究院;国家电网有限公司;江西博微新技术有限公司,未经国网江西省电力有限公司电力科学研究院;国家电网有限公司;江西博微新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310160905.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:分流装置、燃烧装置及VOCs气体处理方法
- 下一篇:一种激光器光纤盘绕装置