[发明专利]基于XML位置信息的高分辨率图像小目标训练方法及系统有效
申请号: | 202210815688.3 | 申请日: | 2022-07-12 |
公开(公告)号: | CN115410099B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 张兆云;蔡德隆 | 申请(专利权)人: | 东莞理工学院 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V10/44 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 朱文振 |
地址: | 523000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xml 位置 信息 高分辨率 图像 目标 训练 方法 系统 | ||
本发明提供基于XML位置信息的高分辨率图像小目标训练方法及系统,方法包括:采集获取线路巡检高分辨率原图像,数据标注线路巡检高分辨率原图像,以生成的xml文件,提取xml文件的对应标注框位置信息;在线路巡检高分辨率原图像中裁剪标注框区域以及周边信息,生成适用新图像;获取线路巡检高分辨率原图像与适用新图像的坐标映射关系,根据坐标映射关系从线路巡检高分辨率原图像剪裁的左上角点和右下角点进行坐标重置,以获得适用新图像的左上角点和右下角点;根据坐标点映射关系同步更新xml文件中对应的目标标注框的位置以及适用新图像的高和宽;将适用新图像输入预置网络中训练,以得到目标区域训练结果。本发明解决了模型训练复杂以及训练效果不佳的技术问题。
技术领域
本发明涉及人工智能领域,具体涉及基于XML位置信息的高分辨率图像小目标训练方法及系统。
背景技术
在电网线路巡检当中,使用无人机设备在高空对电力设备进行拍摄,获取指定线路电力设备的高分辨率图像,通过人工或者智能检测故障点。对于故障设备的检测,传统的做法是由专业的维护人员针对高空拍摄的电力图像进行检查,从而筛选出指定线路中存在故障的设备。但随着深度学习的发展,使用深度神经网络实现对航拍图像的故障检测已经成为电力巡检的关键手段。
电力设备的缺陷目标种类繁多,故障点的大小尺度不一,特别是针对高分辨率图像中的小目标缺陷(螺栓销子缺失、螺栓销子脱销等)的检测更是难点和重点。根据对小目标的定义,主要有以下两种:(1)相对尺寸大小,即目标尺寸的长宽均为原图像长宽的10%以内;(2)绝对尺寸大小,即目标尺寸小于32*32像素。针对高空拍摄的电力设备图像,像素达到4000*3000以上,均为高分辨率图片,比如螺栓销子缺陷类,在原图像中的像素不超过100*100,目标长宽均小于原图长宽的10%,属于小目标。
针对高分辨率图像的小目标故障检测,使用目前主流的一阶段和二阶段算法对高分辨率图像的输入采取剪切和压缩的方法:(1)例如公开号为CN111783590A的现有专利申请文献《一种基于度量学习的多类别小目标检测方法》将深度学习的特征表达能力与度量学习的相似性判别能力相结合,设计了新型深度神经网络结构。其特点是采用结合特征金字塔网络(Feature Pyramid Network,FPN)的Faster RCNN网络结构基于整张图像数据对多类别小目标进行检测,并在该网络中嵌入图网络模块对图像内各区域间的相似度信息进行传递计算,在该网络后端采用基于三元组损失的相似性度量模块区分样本间的细节信息。如前述现有文献中的技术方案直接对原图按照指定尺寸剪切成多张图片输入网络中进行训练,这种处理方法大大增加网络的训练负担,同时如何处理好图片与图片之间的切割线上的目标又是一个难点,需要通过一定的重叠区域来解决,这同时也增加了模型训练的时间与复杂性;(2)例如公开号为CN113807450A的现有专利申请文献《一种基于超高分辨率图片的无人机电力巡线故障检测方法》包括如下步骤:步骤一、建立无人机航拍输电线路故障类型图片数据集;步骤二、建立YOLO检测模型;步骤三、YOLO检测模型通过低分辨率的切图和对应的xml文件进行训练,得到训练好的YOLO检测模型;步骤四、对待检测的无人机航拍输电线路故障类型图片输入训练好的YOLO检测模型得到检测结果。如前述现有文献披露的技术方案中,对高分辨率图像进行缩放至固定尺寸,对于高分辨率图像的小目标来说,其原有信息较少,经过缩放,直接使得原本属于小目标的故障点特征信息大幅度丧失,从而导致网络很难真正学习到故障点的特征,以yolov5算法为例,其默认输入网络的图像尺寸为640*640,在4500*3500的高分辨率电力图像中,螺栓销子缺失/脱落的故障点区域的像素低于100*100(以100*100为例),当4500*3500整体缩放至640*498(498将被进一步数据增强至640)时,故障点的区域相应地被缩放至14*14,仅剩原有信息的1/7,网络所能提取到的特征更少,直接导致模型的训练效果不佳。
综上,现有技术存在模型训练复杂以及训练效果不佳的技术问题。
发明内容
本发明所要解决的技术问题在于如何解决模型训练复杂以及训练效果不佳的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞理工学院,未经东莞理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210815688.3/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置