[发明专利]一种分割图像中异常区域的深度学习算法在审
申请号: | 202110313181.3 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113034516A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 姚健;朱奕健;余家伟;胡超;顾建峰;陆海妹 | 申请(专利权)人: | 联通(上海)产业互联网有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 池州市卓燊知识产权代理事务所(普通合伙) 34211 | 代理人: | 李强 |
地址: | 200050 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分割 图像 异常 区域 深度 学习 算法 | ||
本发明涉及无监督图像异常分割技术领域,尤其为一种分割图像中异常区域的深度学习算法,包括以下步骤:S1,首先作正样本图像特征提取,本发明通过设计分割图像中异常区域的深度学习算法达到算法准确度高;推理时间和内存占用为常数量级,与正样本参考图片数量无关;算法流程简单,只需选取最优的单个层级特征表示,无需多层级特征融合的效果,同时分割阈值可根据实际情况采取不同选取方式,算法的泛化能力好,易于复用,解决了现有的无监督异常分割算法准确度不高、推理时间长、内存占用大等问题,进而能够准确且高效地分割异常区域,且不需要多层级特征融合即可达到当前最优效果。
技术领域
本发明涉及无监督图像异常分割技术领域,尤其涉及一种分割图像中异常区域的深度学习算法。
背景技术
现存的无监督异常分割算法,主要有两种:1.基于重建的方法,通过自编码器(AutoEncoder)重建正样本图片,由于异常样本重建前后差异较大从而分割出异常区域,此类方法模型参数量大、训练时间长,对复杂图案重建效果不佳,分割准确度不高;2.基于预训练网络提取特征表示,并用knn等方法进行图像检索,将待测图片与特征空间上最临近的正样本参考图片作对比,分割出异常区域,该方法需要构建正样本特征字典,字典的内存占用、knn搜索时间都与正样本参考图片的数量成正比,当数据量非常大时,该算法非常耗时,另外,特征提取器通常是卷积神经网络,为获取不同感受野的特征表示,需要进行多层级特征融合。
综上所述,本发明通过设计一种分割图像中异常区域的深度学习算法来解决存在的问题。
发明内容
本发明的目的在于提供一种分割图像中异常区域的深度学习算法,为了克服现有的无监督异常分割算法准确度不高、推理时间长、内存占用大等问题,本发明创造提供一种新型解决方案,可以准确且高效地分割异常区域,且不需要多层级特征融合即可达到当前最优效果。
为实现上述目的,本发明提供如下技术方案:
一种分割图像中异常区域的深度学习算法,包括以下步骤:
S1,首先作正样本图像特征提取:使用基于大规模公开数据集(ImageNet)训练的分类网络ViT(视觉transformer)预训练模型,对正样本训练集提取特征,得到的数据体维度表示为(N,C,H,W);
S2,然后对该数据体作统计量计算,对空间位置(i,j)(i的范围为[0,H],j的范围为[0,W])的特征按通道求均值,C_mean(i,j)即对应位置的特征的均值,其是一个长度为C的向量;以及C_corr(i,j),表示对应位置的特征的协方差矩阵,其是一个CxC大小的对称矩阵,需要将这两个统计量保存,为后面测试时计算马氏距离所用;
S3,接下来是测试阶段,同样用ViT提取被测图片的特征表示,然后使用马氏距离作为距离度量,其中,xij表示被测图片在(i,j)空间位置的特征向量,uij和Σij就是在正样本训练数据上统计并保存的(i,j)位置上的特征均值和协方差矩阵,并且通过马氏距离公式计算马氏距离;
S4,最后,例如一张被测图片,其各个空间位置都可计算出与正样本训练集特征的马氏距离,得到一个(H,W)的马氏距离图,通过分割阈值筛选,做到图像块的正常/异常二分类,实现异常区域分割,并且将这个(H,W)的距离图的最大值记作异常值s,以及通过分类阈值筛选,做到全图的正常/异常二分类,即实现异常分类,对于分类和分割阈值的确定,提前人工标注一些真值,通过最大化AUCROC确定阈值或者在完全没有标注信息的情况下,通过正样本验证集,确定分类和分割的阈值。
优选的,所述S1中N表示训练用到的样本数量,C表示特征维度数,H和W分别的特征图的高和宽。
优选的,所述S2中的协方差矩阵计算公式为:
优选的,所述S3中马氏距离公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联通(上海)产业互联网有限公司,未经联通(上海)产业互联网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110313181.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序