[发明专利]面向视网膜眼底图像中的多尺度小目标检测方法在审
申请号: | 202110262435.3 | 申请日: | 2021-03-11 |
公开(公告)号: | CN115082372A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 张欣鹏;赵萌;杨虹霞;敖吉;陈胜勇 | 申请(专利权)人: | 天津理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/44;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 视网膜 眼底 图像 中的 尺度 目标 检测 方法 | ||
一种面向视网膜眼底图像中的多尺度小目标方法,属于计算机视觉和医学图像处理领域。以深度卷积神经网络为基础,使用了8种眼底公共数据集,通过基于Laplacian尺度空间理论计算每个小目标以及负样本的最佳感受野,从而得到每个小目标的多种尺度的patch图片,以训练如图2所示网络模型,在完成基本的二分类任务的基础上,进一步解决了多尺度眼底图像的分类问题。如图2,该网络模型使用全新提出的T型网络架构,提出ASPP方法处理不同尺度的输入图像,并加强特征表达和对显著特征的关注,从而得到较为优秀的分类结果。本发明适用于多尺度的眼部医疗数据,用于进行眼部图像的分类任务。
技术领域
本发明涉及一种面向视网膜眼底图像中的多尺度小目标检测方法,属于计算机视觉和医学图像处理领域。
背景技术
微动脉瘤(microaneurysm,MA)是视网膜眼底图像中的一种小目标,也被认为是糖尿病视网膜病变(Diabetic retinopathy,DR)的最早期病变,在彩色眼底图像中,MA表现类圆形暗红色斑点且尺度不一。眼科医生通过手动检查的方法耗时费力。因此,准确的MA检测计算机辅助技术对于DR的大规模筛选至关重要。已经公开了许多方法来检测公共数据库和临床数据库上的MA。在将深度学习广泛应用于计算机视觉任务之前,传统方法旨在设计一个两阶段框架并提取手工特征进行分类。此外,还基于端到端架构引入了深度学习技术,以提取上下文特征并检测MA。
许多研究提出了分别检测MA的两阶段框架。数学形态学技术被用于候选人的提取,导致了一些MA和大量非MA的出现。通过监督分类器(例如k近邻(k-nearest neighbor,KNN))提取视觉特征以进行准确分类。研究了RGB视网膜眼底图像的成像原理,并得出结论,绿色通道包含最多的视网膜信息,其对比度最高。因此,绿色通道始终用于MA检测。此外,该方法提出了一种用于对比度增强和阴影校正的非线性多项式运算符。为了提高候选者提取的性能,引入了基于过滤器的模板匹配而不是形态,以排除错误的候选者(例如血管和出血)。仍然存在尽管可以粗略地检测到更多的MA,但候选集中有大量的非MA。为了区分它们,研究了多种特征(例如统计,形状和纹理)以进行分类。一种统计特征沿着不同方向扫描强度,并计算横截面轮廓。MA在轮廓中心表征了一个确定的高斯峰。因此,这种特征已经在分类阶段得到了广泛的应用,并取得了显着的效果。基于MA的圆形形状使用高斯滤波器提取沿多个方向的圆形候选,并发现了一组来自形状自适应滤波器的局部收敛指数特征,细血管的碎片可以被准确地去除。此外,许多方法对MA的局部区域进行了编码,并生成了一种可以检测真实MA的稀疏纹理特征。取决于局部二值图案(local binary pattern,LBP)的旋转和亮度不变,利用LBP运算来表示MA的局部纹理特征。然而,由于手工特征的低表示能力,这些提到的方法仍然遭受有限的检测精度。
最近,深度卷积神经网络(deep convolutional neural network,DCNN)技术已广泛应用于MA检测。先前提出了一种基于卷积神经网络(convolutional neural network,CNN)的像素级MA分类方法。在RGB彩色眼底图像中,每个像素都可以分为MA或非MA。基本的CNN计算出训练图像的概率图,并生成类似于MA的信息性补丁。为了更准确地进行分类,较深的最终CNN为每个MA获得了一组候选补丁,并使用磁盘内核平滑了概率图并消除了噪声。应用形态学算法和高斯滤波器可以来抑制背景噪声。为了方便起见,所有图像的分辨率都通过双三次插值进行了归一化。为了提高代表性由于具有CNN的功能,因此使用了来自同一域的另一个数据集对网络进行了重新训练。此外,只有可以提取特定特征的图层才经过微调,同时冻结了其他图层的权重和偏差,这种交错冻结的方式可以减少计算成本。集中于网络校正和重新分类,类似于强化学习。重新分类网是由容易发生的错误分类结果驱动的。重新分类网络的目的是最大程度地减少精炼分类结果与基本事实之间的差异。为了提高准确性,引入了一个验证网来确定是否接受重新分类结果。与基于两阶段框架的方法相比,基于深度学习的方法对MA分类的准确性更高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110262435.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序