[发明专利]一种图像分类模型的构建方法、图像分类方法及存储介质有效
申请号: | 202110356938.7 | 申请日: | 2021-04-01 |
公开(公告)号: | CN113191390B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 张旭明;周权 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/80;G06K9/62;G06N3/04;G06T3/40 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 祝丹晴 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 模型 构建 方法 存储 介质 | ||
本发明公开了一种图像分类模型的构建方法、图像分类方法及存储介质,所构建的图像分类模型包括依次级联的卷积层、第一金字塔卷积单元、第二金字塔卷积单元、...、第n金字塔卷积单元、池化层和全连接层;第i金字塔卷积单元采用数量为n‑i+1的不同尺度的卷积核分别对当前输入的特征图进行进一步的特征提取后,依次对各尺度的卷积核提取的特征图,将其与其前一级卷积核提取的融合特征图进行融合,得到各尺度的卷积核提取的融合特征图,即一组含有不同尺度信息的特征图;将含有不同尺度信息的特征图与当前输入的特征图进行融合,得到包含多尺度信息的输出特征图;i=1,2,…,n;本发明充分利用了不同尺度信息,图像分类准确性较高。
技术领域
本发明属于图像处理技术领域,更具体地,涉及一种图像分类模型的构建方法、图像分类方法及存储介质。
背景技术
图像分类技术是计算机视觉的核心,在很多领域中都有着广泛的应用,如:安防领域的人脸识别和智能视频分析、交通领域的交通场景识别,互联网领域的图像检索以及医学领域的医学图像分析等。以医学图像为例,医生在临床诊断中可通过对影像设备(如核磁共振成像、超声成像和光学断层成像等设备)采集到的图像进行识别,以实现疾病筛查目的。然而,人工识别效果极大地依赖于医生的临床经验,同时医生的诊断效率也受到巨大医学数据量的影响,容易由于医生过度疲劳而导致误诊或漏诊。目前,自动化的计算机辅助诊断技术已被广泛应用于医学图像识别领域中,它利用计算机的强大计算能力对图像进行处理和分析,为临床医生提供具有参考价值的信息,并大大减少医生的工作负担。
近年来,深度学习算法在图像分类领域得到广泛关注。与基于浅层学习获得手工特征的传统机器学习算法相比,深度学习方法通过联合多个非线性浅层特征,并在此基础上构造出更加抽象的高阶特征。如同大脑的深度结构,深度学习中,每一个输入对象会以多层抽象形式表现出来,每个层次对应于不同的皮层区域。深度学习的优势在于它获得的多层次特征是使用通用的学习过程从原始数据中学习获得的,而不是由手工筛选设计出来。目前较为常用的深度学习模型有深度玻尔兹曼机、深度信念网络、栈式自动编码器、递归神经网络以及卷积神经网络。其中卷积神经网络在图像处理中被广泛使用,并在许多医学图像识别任务中取得了不错的效果。然而,目前大部分网络模型提取图像特征信息时仅使用单一的卷积核,对目标区域变化较大的图像,很难完整地捕捉不同细节大小的特征信息,同时这些网络未能充分利用不同尺度的特征信息,也没有解决好特征融合过程中所产生的信息冗余问题,导致有用信息无法凸显而无用信息无法被抑制,分类的准确性偏低。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供一种图像分类模型的构建方法、图像分类方法及存储介质,用以解决现有技术由于未能充分利用不同尺度的特征信息而存在分类准确性较低的技术问题。
为了实现上述目的,第一方面,本发明提供了一种图像分类模型的构建方法,包括以下步骤:
S1、搭建图像分类模型;图像分类模型包括:依次级联的卷积层、第一金字塔卷积单元、第二金字塔卷积单元、...、第n金字塔卷积单元、池化层和全连接层;第一卷积层用于提取输入图像的初始特征图,并输出至第一金字塔卷积单元;第i金字塔卷积单元用于采用数量为n-i+1的不同尺度的卷积核分别对当前输入到第i金字塔卷积单元的特征图进行进一步的特征提取后,依次对各尺度的卷积核提取的特征图,将其与其前一级卷积核提取的融合特征图进行融合,得到各尺度的卷积核提取的融合特征图,即一组含有不同尺度信息的特征图;将含有不同尺度信息的特征图与当前输入到第i金字塔卷积单元的特征图进行融合,得到包含多尺度信息的输出特征图;其中,i=1,2,…,n;对于各尺度卷积核,其尺度大于其前一级卷积核的尺度;
S2、将按照预设分类任务采集的训练集输入到上述图像分类模型中进行训练,得到训练好的图像分类模型。
进一步优选地,输入图像为对训练集中原始样本图像进行尺度缩放后的图像,以提高计算效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110356938.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序