[发明专利]基于语义分割的红外图像光伏组件视觉识别方法在审
申请号: | 202110589024.5 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113538453A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 刘锋;周倩男;吴楠;王海峰;褚上海 | 申请(专利权)人: | 旻投电力发展有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136;G06T5/00;G06T5/30;G06T5/40 |
代理公司: | 江苏长德知识产权代理有限公司 32478 | 代理人: | 冯娟 |
地址: | 211100 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 分割 红外 图像 组件 视觉 识别 方法 | ||
1.基于语义分割的红外图像光伏组件视觉识别方法,其特征在于,包括:
使用语义分割算法进行光伏组件串区域的准确快速分割;
对光伏组件串区域进行图像增强,提高间隙与光伏组件区域的对比度;
使用最大熵阈值分割算法与Hough直线变换从光伏组件串图片中提取出分离直线,分离光伏组件;
使用连通区域提取算法提取图片中的光伏组件区域;
对光伏组件区域进行透视校正,消除拍摄角度影响。
2.根据权利要求1所述的基于语义分割的红外图像光伏组件视觉识别方法,其特征在于,所述语义分割算法由特征提取和掩模预测两部分组成;
其中,特征提取使用图像卷积和空间金字塔结构提取图像特征,掩模预测是对特征图进行上采样和像素分类得到目标分割掩模;
A.特征提取:
图像卷积通过卷积核提取图像特征,假设输入图像第h行w列像素为x(h,w),卷积核w2n+1为边长2n+1的方阵,卷积输出yc(h,w):
式中卷积输出yc(h,w)通过线性修正函数获取非线性功能,卷积输出通过空间金字塔结构,使用不同间隔卷积核提取图像不同感受野特征,将不同感受野特征融合得到图像的多尺度信息;
B.掩膜预测:
首先使用双线性插值将特征图上采样到原图大小,然后使用大小为1*1的卷积核融合图像中每个像素的特征;使用Logistic函数将融合结果放缩[0,1]范围内,计算像素属于不同类别的概率:
式中,ycf表示融合后的特征值,k为常数,实验中k取1,并根据像素类别概率yp(h,w)得到语义分割结果:yp(h,w)接近0时像素属于背景区域,yp(h,w)接近1时像素属于目标区域。
3.根据权利要求1所述的基于语义分割的红外图像光伏组件视觉识别方法,其特征在于,所述图像增强包括k近邻中值滤波、直方图均衡和Gamma变换三个步骤;
A.K近邻中值滤波:
以待处理的像素为中心构造一个N′N的模板,N取奇数;在N′N个像素中选取与待处理的像素值相近的k个近邻点,以k个近邻点的中值代替待处理的像素值;
B.直方图均衡:
将图像分为8*8大小相同的矩形,计算每一个矩形的直方图,并进行归一化;设置阈值T,统计归一化直方图中高于T的部分,设这部分的和为total;将total平均分给所有的灰度级,每个灰度级分到计算直方图的升高高度Upper=T-L;对直方图进行如下处理:
式中,k=1,2,...,255;h′(i)为限制对比度后灰度值为k的像素出现的概率。
C.Gamma变换:
go(i,j)=cgi(i,j)γ (4)
式中,c为补偿系数,g为γ系数,调整补偿系数和γ系数,图像会获得不同的增强效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于旻投电力发展有限公司,未经旻投电力发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110589024.5/1.html,转载请声明来源钻瓜专利网。