[发明专利]一种基于多重感受野的图像分类方法、系统及装置在审
申请号: | 201711241804.0 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108062559A | 公开(公告)日: | 2018-05-22 |
发明(设计)人: | 张金区;鲁玉佳;张肖霞;熊孝天;欧建荣 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多重 感受 图像 分类 方法 系统 装置 | ||
本发明公开了一种基于多重感受野的图像分类方法、系统及装置,包括:建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;建立第二层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;根据第三层输出特征按照类别个数进行降维,输出到分类器中进行图像分类识别处理。本发明通过不同扩张卷积因子获取多个感受野下的图像信息作为下一层网络的输入,并采用堆栈式训练的方法进行逐层训练,使得模型更好地逼近图像特征,而且通过三层模型结构,能更全面地提取图像特征,大大提高图像分类识别的准确率。本发明可广泛应用于图像分类识别中。
技术领域
本发明涉及图像分类技术领域,尤其涉及一种基于多重感受野的图像分类方法、系统及装置。
背景技术
随着科学技术的快速发展,人们愈加期待计算机可以智能地帮助我们完成一些任务,计算机通过自主学习或者人为训练等之后可以模拟人类处理一定的任务,这一技术领域称为人工智能。图像识别是人工智能的一个重要领域,是一种利用计算机对图像进行处理、分析和理解从而识别图像中目标和物体的技术。图像识别技术应用广泛,文字识别、车牌号码识别、人脸识别、场景分类、行人检测、机器人视觉等等,这些都属于图像分类。随着大数据时代的到来,GPU、超级计算机、云计算等这些高性能计算平台的迅猛发展,如何利用结合大数据和高性能计算技术逐渐成为图像分类的主要研究方向。
目前,在图像处理领域效果最佳的算法当属卷积神经网络了,但是仍然存在一些问题,比如模型对数据依赖性太强、兼容性较差,卷积操作只能提取局部特征等,导致识别准确率较低。
发明内容
为了解决上述技术问题,本发明的目的是提供一种能提高分类准确性的基于多重感受野的图像分类方法、系统及装置。
本发明所采取的技术方案是:
一种基于多重感受野的图像分类方法,包括以下步骤:
批量输入图像;
根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;
根据第一层输出特征,建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;
根据第二层输出特征,建立第三层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;
根据第三层输出特征按照类别个数进行降维,并进行全局平均池化处理,进而输出到分类器中进行图像分类识别处理。
作为所述的一种基于多重感受野的图像分类方法的进一步改进,所述的根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征,这一步骤具体包括:
建立第一层模型,采用扩张卷积因子对输入图像进行扩张卷积处理,得到所有扩张卷积结果的均值,并通过激活函数进行批归一化处理,得到初步第一层输出特征;
将初步第一层输出特征进行扩张转置卷积处理,得到卷积均值,并通过激活函数进行批归一化处理,得到还原图像;
采用改进的损失函数对第一层模型进行训练,并调整模型参数,进而得到调整完后的第一层输出特征。
作为所述的一种基于多重感受野的图像分类方法的进一步改进,所述的改进的损失函数具体包括:
根据输入图像和还原图像,将图像中每4*4像素的区域展开为一个16个元素长的一维向量,并将输入图像和还原图像分别重新存储为16维向量的结构;
依次通过不同的扩张卷积因子,计算对应的尺度下每个向量的对比度因子c(x,y)和结构对比因子s(x,y)的乘积,并对每个尺度下的乘积进行累乘,得到多尺度乘积结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711241804.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:液位报警器用运输固定设备
- 下一篇:一种海藻酸钠及其制备方法和应用
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序