[发明专利]一种基于量子化自编码器的无监督缺陷检测方法在审
申请号: | 202110541834.3 | 申请日: | 2021-05-18 |
公开(公告)号: | CN115375604A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 李勃;邱正;任福继;管越;田梦阳 | 申请(专利权)人: | 南京大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N10/80;G06N3/08 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 奚铭 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 量子化 编码器 监督 缺陷 检测 方法 | ||
1.一种基于量子化自编码器的无监督缺陷检测方法,其特征是构建一个量子化自编码器用于缺陷检测,量子化自编码器包括编码网络、编码表和解码网络,
量子化自编码器对输入图像进行归一化预处理,将预处理后的图像输入编码网络中,映射得到中间特征图,并加上位置编码信息;然后将中间特征图中每个向量与编码表中的向量进行最邻近匹配,用最接近的向量对其进行替换,得到量化的特征图;将量化后的特征图输入到解码网络中,解码网络将特征图重新恢复成图片;使用无缺陷的训练样本图像训练量子化自编码器;
缺陷检测时,将待检测图像进行归一化预处理后输入训练好的量子化自编码器,对于原图和量子化自编码器重建的图片,判别和定位缺陷。
2.根据权利要求1所述的一种基于量子化自编码器的无监督缺陷检测方法,其特征是量子化自编码器具体为:
1)编码网络encoder:
输入编码网络的图像映射到一个潜在空间中,得到连续的编码向量z′e:
z′e=encoder(x)
在编码器中加入位置编码position encoding,用位置信息来对特征进行约束,采用Transformer中的提出的Sinusoidal Position Encoding:
编码向量z′e与位置编码相加共同组成最终的特征向量ze;
2)构建编码表和向量量化:
构建一个容量为K的Embedding层,其中每个向量的维度均为64,将其随机初始化:
E=[e1,e2,e3...eK]
对于1)中得到的特征向量ze,通过最邻近搜索匹配这K个向量中最相似的向量,记为zq,使连续的编码向量实现离散化;
3)解码网络decode:
将得到的编码向量zq输入到解码网络中,解码网络对编码向量进行上采样并重建原图:
x′=decoder(zq)
其中,使用直通估计的方法,在前向传播时使用zq进行计算,在反向传播时使用ze计算梯度:
decoder(zq)→decoder(ze+sg[zq-ze])
sg表示不计算梯度,这样在前向传播时该式等价于decoder(zq),在反向传播时由于zq-ze不提供梯度,该式等价于decoder(ze)。
3.根据权利要求2所述的一种基于量子化自编码器的无监督缺陷检测方法,其特征是编码网络由底层编码器和顶层编码器组成,编码器由若干卷积层、BN层和ReLU层组成的残差模块堆叠而成;
图像输入到编码网络后首先经过底层编码器被下采样四倍,得到底层特征图,然后通过顶层编码器进一步下采样两倍,得到顶层特征图,底层特征图和顶层特征图分别加上各自对应的位置编码,然后顶层特征图上采样两倍后与底层特征图合并,此处的特征图即编码网络的输出ze,ze为一个m×m×64的多维向量:
之后通过1×1卷积层将ze的维度压缩到64,然后在向量字典中进行最邻近搜索来实现向量量化。
4.根据权利要求2所述的一种基于量子化自编码器的无监督缺陷检测方法,其特征是构建编码表和向量量化中,ze中每个位置的向量都与向量词典ek中的所有向量计算余弦距离,k∈(1...K),并与向量词典中最接近的向量的索引进行替换,从而实现离散化:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110541834.3/1.html,转载请声明来源钻瓜专利网。