[发明专利]基于超分辨率和半监督学习的装配式预制构件检测方法有效

专利信息
申请号: 202211532025.7 申请日: 2022-12-01
公开(公告)号: CN116012296B 公开(公告)日: 2023-10-24
发明(设计)人: 万华平;张文杰;胡鹏华;葛荟斌 申请(专利权)人: 浙江大学
主分类号: G06T7/00 分类号: G06T7/00;G06T3/40;G06T5/00
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 孙家丰
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 分辨率 监督 学习 装配式 预制构件 检测 方法
【权利要求书】:

1.一种基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于,包括以下步骤:

A.训练超分辨率网络Real-ESRGAN;

A1.收集预制构件图片,对数据进行预处理,得到超分辨率网络Real-ESRGAN的训练数据集;

A2.搭建Real-ESRGAN网络,该网络由生成模型G和鉴别模型D组成。生成模型G利用输入的低分辨率图生成相应的超分辨率图,而鉴别模型D会判断图片是由生成模型生成的超分辨率图还是原始的高分辨率图。通过G和D之间不断的相互博弈提升生成图片的质量;

A3.训练Real-ESRGAN网络:首先固定G的参数,并训练D使其能够准确区分真实图像和生成图像;然后,固定D的参数,并训练G使其生成能混淆D的超分辨率图片。重复以上过程,最后得到所需的生成模型;

B.收集各种施工环境下的装配式预制构件图片,并输入到Real-ESRGAN网络的生成模型中,将图片分辨率放大至原先的两倍,提升图片质量;

C.使用半监督学习算法训练目标检测模型Yolov5;

C1.将提升质量后的图片划分为训练集与测试集,并对其中50%图片进行标注,获得标注图片xl、标签y、未标注图片xu;对原始数据集(xl,xu)分别加上随机噪声,构成训练数据集,记为(xl',x'u)和(xl”,x'u');

C2.搭建半监督学习框架mean-teacher网络,该框架由两个相同结构的student网络和teacher网络组成;

C3.以Yolov5模型作为student网络和teacher网络的目标检测器,将加了随机噪声后的数据(xl',x'u)和(xl”,x'u')分别输入到student网络和teacher网络中,得到其输出结果。并根据一致性正则化准则计算其损失值,迭代更新student网络和teacher网络参数。最后将训练好的student网络在测试数据集上验证其性能;

D.使用训练后的Yolov5模型检测施工现场采集的图像或视频数据,对建筑工地上装配式预制构件进行定位和分类。

2.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于:所述步骤A1中的数据预处理包括:图片被调整至相同大小,为避免图片失真,图片长边缩放至640像素,而短边会保持图片原长宽比缩放至对应大小,记为s,故原始高分辨率图片尺寸记为(640,s);再将高分辨率图片尺寸缩放至(320,s/2),作为输入生成模型的低分辨率图片;高分辨率图和低分辨率图共同组成Real-ESRGAN的训练数据集。

3.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于:所述步骤A3的训练损失函数包括:L1距离损失L1,对抗损失LG和感知损失Lpercep,其函数可分别表示为

Lpercep=||φ(z)-φ(G(z))||1    (3)

其中z,y和x分别代表输入的低分辨率图片、生成的超分辨率图片和高分辨率图片;||·||,和φ(·)分别代表L1范数、期望函数和VGG损失函数。最终的损失值由以下公式得出

L=ηL1+λLG+Lpercep     (4)

其中η和λ代表权重系数,分别取为1和0.1。

4.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测方法,其特征在于:所述步骤C2中的mean-teacher网络由student网络和teacher网络组成,其中student网络通过随机梯度下降法进行参数优化,而teacher网络根据student网络的参数进行更新。

5.根据权利要求1所述的基于超分辨率和半监督学习算法的装配式预制构件检测技术,其特征在于:所述步骤C3中的训练损失函数包括student网络损失函数和teacher网络优化函数:

所述student网络损失函数包括监督学习损失Lsl和基于一致性正则化准则的半监督学习损失Lssl,其函数分别表示为

Lsl=LOD[fs(x′l),yl]    (5)

Lssl=LOD[fs(x′l,x'u),ft(x″l,x″u)]    (6)

其中LOD代表目标检测器的损失函数,fs代表student网络,ft代表teacher网络。总损失记为LT=Lsl+Lssl

所述teacher网络在第t个训练轮次时的参数θt'可以通过以下方式给出

θt'=αθt'-1+(1-α)θt (7)

其中θt代表student网络的参数,α代表平滑参数,随着训练轮次的增加而增大。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211532025.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top