[发明专利]一种基于自适应锚框的铝材质图像缺陷检测方法有效
| 申请号: | 202011043557.5 | 申请日: | 2020-09-28 |
| 公开(公告)号: | CN112085735B | 公开(公告)日: | 2022-10-25 |
| 发明(设计)人: | 田智强;董靓杰;王欢;许博;郑尧月 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/44;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 王艾华 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 自适应 材质 图像 缺陷 检测 方法 | ||
本发明提出了一种基于自适应锚框的铝材质图像缺陷检测方法,以解决当前缺陷检测方法不够灵活且检测精度较低等问题。首先,本发明采用了使用分组卷积和可形变卷积思想的ResNeXt‑101作为骨干网络,将包含注意力机制的特征增强模块集成到骨干网络,然后送入到特征金字塔网络中进行多尺度特征融合,从而提高缺陷检测精度;其次,本发明使用了一个自适应锚框神经网络,自动根据缺陷特征学习对应的锚框参数,提高锚框定位检测的精度;然后,在框预测阶段采用级联网络结构,解决训练阶段和预测阶段精度不匹配的问题;最后,本发明对形状差异大的缺陷和小目标缺陷的检测精度均有大幅提升,对铝材质图像缺陷检测的总体精度较高,在缺陷检测领域有较高的应用价值。
技术领域
本发明属于计算机视觉和缺陷检测领域,主要采用深度学习的思想,具体涉及一种基于自适应锚框的铝材质图像缺陷检测方法。
背景技术
铝型材是所有工业化国家的支柱产业,具有强度高,重量轻,耐磨,装饰性好,环保和经济等特点,越来越多的建筑师开始使用铝型材作为建筑材料。因此,质量已成为铝型材的关键评估标准。然而在实际生产中,由于生产流程的影响,铝材质表面可能产生不导电,刮擦,粗粒,外露板,起泡,凹坑,突起的颗粒,板角暴露,油漆痕迹和杂色等缺陷。由于恶劣的环境和高成本,非接触式检测是确保产品质量的重要步骤。
缺陷检测的困难如下:1)边界不明显,缺陷与背景的边界模糊;2)人工标注时可能不统一;3)传统方法只能统计特定类别的特征;4)缺陷的尺寸和形状不规则,很难准确预测位置。在实际工业生产中,这些缺陷可能会出现在任何地方,使用计算机自动识别并定位这些缺陷是不可缺少的步骤。
最初的缺陷检测方法为人工肉眼检测,但是这不足以满足快速生产的需要。后来业界开始采用传统的机器学习方法,比如纹理统计算法,Halcon软件等,但由于铝型材的表面可能包含很难与缺陷区分的图案,使得这些方法也有很大的局限性,缺乏泛化导致效率和准确性降低。最近,铝型材制造商正在尝试应用最新的人工智能(AI)技术来彻底改变现有的质检流程。AI技术使用卷积神经网络(CNN),从图像中提取缺陷特征并抽象为非线性模型。这种方法只需要少量的人工参与,且可以在整个流程中充分掌握产品表面质量的状态。
经过调研,我们发现现有的缺陷检测方法主要存在以下几点不足:1)CNN可以更好地定位缺陷,但是在许多先进的检测器中,需要预先设置锚的形状和大小。设置锚框的步骤如下:首先人工统计所有缺陷特征,可以采用数学统计工具,然后将这些特征进行归一化操作,分析出一些尽量符合所有特征的锚框的长宽比及大小的参数,最后根据这些参数信息,设置锚框的参数。但由于缺陷的复杂性和多样性,这种人工设计的锚框无法完全覆盖所有的缺陷,且不具备灵活性。因此,我们提出了一种根据所有缺陷特征自动生成锚框的模型,同时结合了一个特征增强的注意力模块,用于在特征提取阶段增强缺陷特征。
发明内容
本发明的目的在于提供一种基于自适应锚框的铝材质图像缺陷检测方法,以解决当前检测方法效果不好,检测手段不够灵活的问题。
为了达到上述目的,本发明采用以下技术方案:
步骤一,采用图片下采样技术,将所有的图片下采样至统一尺寸,从而使输入维度具有一致性;
步骤二,将步骤一中得到的图片输入到一个使用分组卷积和可形变卷积思想的残差神经网络中,从而得到输入图片的特征图;
步骤三,把步骤二输出的特征图输入到使用通道注意力和空间注意力机制的特征增强模块中,进行缺陷特征的表达增强;
步骤四,将步骤三中生成的增强后的特征图,输入到特征金字塔网络进行特征融合,进一步完成特征增强;
步骤五,将步骤四得到的增强后的特征输入到加入了自适应锚框的RPN网络中,进行锚框参数的学习,并生成相应的候选框;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011043557.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





