[发明专利]基于超分辨率和半监督学习的装配式预制构件检测方法有效
申请号: | 202211532025.7 | 申请日: | 2022-12-01 |
公开(公告)号: | CN116012296B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 万华平;张文杰;胡鹏华;葛荟斌 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T3/40;G06T5/00 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 孙家丰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分辨率 监督 学习 装配式 预制构件 检测 方法 | ||
1.一种基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于,包括以下步骤:
A.训练超分辨率网络Real-ESRGAN;
A1.收集预制构件图片,对数据进行预处理,得到超分辨率网络Real-ESRGAN的训练数据集;
A2.搭建Real-ESRGAN网络,该网络由生成模型G和鉴别模型D组成。生成模型G利用输入的低分辨率图生成相应的超分辨率图,而鉴别模型D会判断图片是由生成模型生成的超分辨率图还是原始的高分辨率图。通过G和D之间不断的相互博弈提升生成图片的质量;
A3.训练Real-ESRGAN网络:首先固定G的参数,并训练D使其能够准确区分真实图像和生成图像;然后,固定D的参数,并训练G使其生成能混淆D的超分辨率图片。重复以上过程,最后得到所需的生成模型;
B.收集各种施工环境下的装配式预制构件图片,并输入到Real-ESRGAN网络的生成模型中,将图片分辨率放大至原先的两倍,提升图片质量;
C.使用半监督学习算法训练目标检测模型Yolov5;
C1.将提升质量后的图片划分为训练集与测试集,并对其中50%图片进行标注,获得标注图片xl、标签y、未标注图片xu;对原始数据集(xl,xu)分别加上随机噪声,构成训练数据集,记为(xl',x'u)和(xl”,x'u');
C2.搭建半监督学习框架mean-teacher网络,该框架由两个相同结构的student网络和teacher网络组成;
C3.以Yolov5模型作为student网络和teacher网络的目标检测器,将加了随机噪声后的数据(xl',x'u)和(xl”,x'u')分别输入到student网络和teacher网络中,得到其输出结果。并根据一致性正则化准则计算其损失值,迭代更新student网络和teacher网络参数。最后将训练好的student网络在测试数据集上验证其性能;
D.使用训练后的Yolov5模型检测施工现场采集的图像或视频数据,对建筑工地上装配式预制构件进行定位和分类。
2.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于:所述步骤A1中的数据预处理包括:图片被调整至相同大小,为避免图片失真,图片长边缩放至640像素,而短边会保持图片原长宽比缩放至对应大小,记为s,故原始高分辨率图片尺寸记为(640,s);再将高分辨率图片尺寸缩放至(320,s/2),作为输入生成模型的低分辨率图片;高分辨率图和低分辨率图共同组成Real-ESRGAN的训练数据集。
3.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于:所述步骤A3的训练损失函数包括:L1距离损失L1,对抗损失LG和感知损失Lpercep,其函数可分别表示为
Lpercep=||φ(z)-φ(G(z))||1 (3)
其中z,y和x分别代表输入的低分辨率图片、生成的超分辨率图片和高分辨率图片;||·||,和φ(·)分别代表L1范数、期望函数和VGG损失函数。最终的损失值由以下公式得出
L=ηL1+λLG+Lpercep (4)
其中η和λ代表权重系数,分别取为1和0.1。
4.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于:所述步骤C2中的mean-teacher网络由student网络和teacher网络组成,其中student网络通过随机梯度下降法进行参数优化,而teacher网络根据student网络的参数进行更新。
5.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测技术,其特征在于:所述步骤C3中的训练损失函数包括student网络损失函数和teacher网络优化函数:
所述student网络损失函数包括监督学习损失Lsl和基于一致性正则化准则的半监督学习损失Lssl,其函数分别表示为
Lsl=LOD[fs(x′l),yl] (5)
Lssl=LOD[fs(x′l,x'u),ft(x″l,x″u)] (6)
其中LOD代表目标检测器的损失函数,fs代表student网络,ft代表teacher网络。总损失记为LT=Lsl+Lssl;
所述teacher网络在第t个训练轮次时的参数θt'可以通过以下方式给出
θt'=αθt'-1+(1-α)θt (7)
其中θt代表student网络的参数,α代表平滑参数,随着训练轮次的增加而增大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211532025.7/1.html,转载请声明来源钻瓜专利网。