[发明专利]一种电力塔杆图像语意分割方法有效
申请号: | 201310102959.1 | 申请日: | 2013-03-27 |
公开(公告)号: | CN103218810A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 吴华;杨国田;李郅诚;柳长安;刘春阳 | 申请(专利权)人: | 华北电力大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 朱琨 |
地址: | 102206 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力 图像 语意 分割 方法 | ||
技术领域
本发明属于计算机视觉与模式识别技术领域,尤其涉及一种电力塔杆图像语意分割方法。
背景技术
电力机器人对电力设备进行巡检已经得到普遍应用。在电力机器人通过拍摄电力杆塔的图像并通过对拍摄图像的解析,实现对电力杆塔的巡检。在电力机器人巡检的过程中,电力杆塔图像的分割与解析成为数据处理与分析中最具挑战性的问题。而电力杆塔图像的分割与普通图像的分割又具有不同的特点:比如,电力塔杆的边缘较多;再比如,从感官上,电力塔杆的图像极易和背景混淆。现有的图像分割算法中的能量函数的形式不具备灵活性,更多地依赖于待分割图像与训练数据集的相似程度,在某一基团内,初始标注相同的超像素仅仅依据特征的区分赋予不同的损失函数,而不考虑周围临域的标注情况;或者损失函数只考虑到基团内超像素个数的影响。电力杆塔的分割面对两大挑战:保持电塔本身的一致性和区分电塔与背景的边缘。本发明提出一种新的基于马尔科夫随机场灵敏代价函数的电力杆塔分割方法。
发明内容
本发明的目的在于,提出一种电力塔杆图像语意分割方法,用于解决现有技术在电力杆塔图像语意分割过程中存在的缺陷。
为了实现上述目的,本发明提出的技术方案是,一种电力塔杆图像语意分割方法,其特征是所述方法包括:
步骤1:对电力塔杆图像进行预处理,将其分割为超像素,选择最匹配的数据集并提取特征;
步骤2:通过电力塔杆图像图像与所述数据集的相似关系,对于每一个超像素赋予初始化的语意标注;
步骤3:将初始化的语意标注,分别代入标注空间和特征空间,并计算标注空间高阶损失函数值和特征空间高阶损失函数值;
步骤4:对损失函数进行优化,得到损失函数的全局最小值,达到图像语意分割的目的。
所述步骤3具体是:
步骤301:在超像素的随机场内定义九阶基团作为马尔科夫随机场,即每个超像素的标注与该超像素的八临域超像素相关;
步骤302:将临域内的超像素分为两类:取主流标注的作为一类,非主流标注的作为另一类;
步骤303:采用城市距离区别四邻域超像素和八临域内非四邻域的超像素;
步骤304:设计标注空间高阶损失函数和特征空间高阶损失函数。
本发明在电塔图像的语意分割中,使同一物体的一致性以及不同物体的边缘都得相应地增强,改进了现有图像分割与解析算法中损失函数单一、灵敏度较低和错误分类率高的问题。
附图说明
图1是电力塔杆图像语意分割方法流程图;
图2是中心超像素的四邻域超像素标注变化图;其中(a)是中心超像素的四邻域超像素标注为0的示意图;(b)是中心超像素的下方超像素标注为1的示意图;(c)是中心超像素的下方和右方超像素标注为1的示意图;(d)是中心超像素的下方、右方和左方超像素标注为1的示意图;
图3是中心超像素的八临域内非四邻域的超像素标注变化图;其中(a)是中心超像素的八临域内非四邻域的超像素标注为0的示意图;(b)是中心超像素的左上方超像素标注为1的示意图;(c)是中心超像素的左上方和左下方超像素标注为1的示意图;(d)是中心超像素的左上方、左下方和右上方超像素标注为1的示意图;
图4是图2和图3中相应的基团绘制的损失函数曲线图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
实施例1
图1是电力塔杆图像语意分割方法流程图,如图1所示,本发明提出的一种电力塔杆图像语意分割方法包括:
步骤1:电力塔杆图像进行预处理,将其分割为超像素,选择最匹配的数据集并提取特征。
预处理指的是分割过程前的工作:包括去除噪声,将原图像变换为超像素,形成的过分割图像(Oversegmentation Image)。超像素(Superpixel)值是具有某种共同特征的十几个或几十个像素的集合,将超像素进行进一步的分割,即可得分割结果。
超像素的形成过程可以将图像中所有像素的RGB数值提取出来,与周围像素的RGB值进行比较,根据需要设定阈值,小于此阈值的,即认为两像素属于同一超像素。
数据集是从事先已经进行标注和分割的图像中进行选择的。进行电力杆塔的图像分割,那么就要从已分割的杆塔图像中选择数据集。为挑选最匹配的数据集,可将待选择图像与待分割图像通过某种特征进行比较,然后排序。排名前列的待选择图像即被认为是最匹配的数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310102959.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序