[发明专利]一种基于深度神经网络的图像离群点检测方法在审
申请号: | 201710461311.1 | 申请日: | 2017-06-16 |
公开(公告)号: | CN107247954A | 公开(公告)日: | 2017-10-13 |
发明(设计)人: | 孙占全;杨美红;李钊;霍继东 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 济南泉城专利商标事务所37218 | 代理人: | 赵玉凤 |
地址: | 250014 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 图像 离群 检测 方法 | ||
技术领域
本发明涉及一种图像离群点检测方法,具体的说,是一种基于深度神经网络的图像离群点检测方法。
背景技术
在进行图像识别分析时,收集的图像数据中存在这样一些图像数据,这些数据并不适合于图像的自动识别分析,还有一些数据由于工作人员的疏忽和误判,将不同类的图像放在同一目录下,从而造成错误的分类数据,这些数据我们称之为不合格数据。这些数据会对图像的智能分析起到很大的影响,如何自动识别这些不合格的图像数据并将其剔除是非常重要的工作。离群检测是一种合适的自动识别方法,图像离群检测分析包括2部分,即图像特征抽取和离群检测。
特征抽取是描述一个模式里包含的相关形状特征,利用该特征可实现模式的分类,许多图像特征提取方法已被提出,常用的特征提取方法是基于图像的颜色、纹理和形状,灰度密度、颜色直方图、颜色矩等是常用的颜色特征,形状特征包含更多的图像可视化信息,如基于傅里叶描述的边界、基于矩不变性的区域、有限元方法、调整函数、小波变换等。纹理是图像的另一个重要特征,一些纹理特征是基于形态学,如协方差矩阵、邻接图等,一些纹理特征是基于统计的,如统计灰度阶特征、直方图特征等。不同的特征反映图像的不同特性,所有这些特征都是通过人的主观设定的。如何客观自动的提取图像特征一直是非常重要的问题,深度神经网络为该问题提供了解决思路。
通过图像特征提取获取图像的特征,需要设计合适的离群检测方法对异常图像进行识别。离群点是在一个数据集中严重偏离大多数数据点的数据点。离群点检测可应用于各种领域,已引起多种学科领域研究人员的关注,如数据挖掘,机器学习,统计和信息论研究人员。目前,针对不同的数据集提出了多种基于不同技术的离群点检测算法,这些算法可分成5大类,即基于统计、基于距离、基于密度、基于深度以及基于聚类检测算法等,其中基于聚类的离群点检测是最有效的方法。在该方向已有大量的研究工作,在基于聚类的离群点检测中,距离测度对于距离结果有很大的影响,常用的距离测度有欧几里得距离、名科夫斯基距离、曼哈顿距离等,但这些距离不能度量变量之间复杂的相关性,Tishby提出了基于信息瓶颈理论的信息损失量,它是一种重要的相关性测度,已在很多复杂的聚类中得到广泛的应用,如图像、文本、星系等复杂聚类问题。但该方法只能度量变量之间的全局概率分布的相关性,不能很好度量对应位置之间的相关性,另外,在一些实际应用中,无法获取数据集的概率分布。为推广信息损失量到更一般的情况,本文提出了基于扩展熵的信息损失量计算方法,该信息损失量应用于离群点检测方法中。
发明内容
本发明要解决的技术问题是提供一种基于深度神经网络的图像离群点检测方法,采用深度神经网络提取图像特征,基于扩展熵的信息损失量度量图像之间的距离,在此基础上,提出基于聚类的图像异常检测方法,不合格图像检测方法的有效性通过实例分析得以验证,并提高不合格图像检测的效率。
为了解决所述技术问题,本发明采用的技术方案是:
一种基于深度神经网络的图像离群点检测方法,包括以下步骤:1、基于深度神经网络进行图像特征提取;2、基于步骤1提取的图像特征,利用基于中心点的聚类方法把图像聚成k组,在该聚类中,基于扩展熵的信息损失作为距离测度;3、在每个聚类中,挑选离群点图像。
本发明所述基于深度神经网络的图像离群点检测方法,步骤1中,采用GoogLeNet模型抽取图像特征,利用imagenet数据库对GoogLeNet进行训练,训练后的模型用于图像特征的自动抽取,训练后的全连接层用做输入图像的特征。
进一步的,训练过程包括预训练阶段和微调阶段,在预训练阶段,ImageNet数据训练GoogLeNet得到ILSVRC模型,然后利用图像对网络进行微调,即利用已训练好的ILSVRC模型的权重,通过修改部分层参数的形式用少量样本进行训练,从而得到更加精确的图像特征提取模型。
本发明所述基于深度神经网络的图像离群点检测方法,步骤2的具体过程为:21)、将提取的图像特征组成数据集X={x1,x1,···,xn},其中n是数据点的个数,xi∈{1,2,···n}是m维向量;
22)、指定聚类数K和截尾阈值ε,通过随机选择方式,选择K个数据点作为初始化聚类中心C0={C1,C2,···Ck};
23)、根据式公式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710461311.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序