[发明专利]一种基于ODE求解器自适应的场景分类方法在审
申请号: | 201910745244.5 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110598746A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 余磊;袁琼雯;何敬伟;罗美露 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 42222 武汉科皓知识产权代理事务所(特殊普通合伙) | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类图像 分类器 神经网络 池化 特征提取模块 场景 分布式特征 输入分类器 场景分类 分类效果 输出结果 样本空间 连接层 求解器 自适应 概率 后向 卷积 求解 维数 映射 逼近 分类 | ||
本发明公开了一种基于ODE求解器自适应的场景分类方法,首先基于后向欧拉逼近的方法构造神经网络,然后对构造的神经网络进行训练获得分类器;接着将待分类图像输入分类器,通过分类器的卷积层调整维数、特征提取模块提取待分类图像的特征、池化层进行池化操作、全连接层将分布式特征映射到样本空间,最后通过softmax层求解输入的待分类图像属于不同类别的概率;最后,选择待分类图像在不同场景类别下概率最高的类别作为分类器的输出结果,从而得到待分类图像所属的场景类别。本发明的方法可以提高分类的精度,改善分类效果。
技术领域
本发明涉及计算机技术领域,具体涉及一种基于ODE求解器自适应的场景分类方法。
背景技术
图像场景分类技术涉及到模式识别、信号处理、计算机视觉等学科的交叉领域,是解决图片搜索、图像识别等问题的关键技术。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
现有技术中,场景分类的方法主要包括三大类。第一类是基于特征的方法;通过提取图像特征(如颜色、形状和纹理等),结合特征描述并设计使用相应的分类器实现,该类方法在背景复杂、目标密集的场景任务中表现差,仅适用于简单的自然场景。第二类是基于语义的方法;局部内容的目标语义相对于场景语义,又可称之为局部语义概念,在第二类方法中,首先对图像进行规则划分,提取各字块的局部图像描述子,建立局部描述子与语义概念之间的联系,再利用局部语义概念之间的概率分布完成场景分类。第三类是基于学习的方法;使用卷积神经网络通过“自学习”的方式来实现,也是近些年来的研究热点,该类方法的出现使人工提取特征的繁重成为过去式,可以实现对特征的自动提取与整合,但是该类方法均是经验性方法,缺乏理论依据以及可解释性,无法进行推导验证。
由此可知,现有技术中的方法存在分类效果不佳的技术问题。
发明内容
有鉴于此,本发明提供了一种基于ODE求解器自适应的场景分类方法,用以解决或者至少部分解决现有技术中的方法存在的分类效果不佳的技术问题。
本发明提供了一种基于ODE求解器自适应的场景分类方法,包括:
步骤S1:基于后向欧拉逼近的方法构造神经网络,其中,构造的神经网络包括卷积层、特征提取模块、池化层、全连接层和softmax层;
步骤S2:对构造的神经网络进行训练获得分类器;
步骤S3:将待分类图像输入分类器,通过分类器的卷积层调整维数、特征提取模块提取待分类图像的特征、池化层进行池化操作、全连接层将分布式特征映射到样本空间,最后通过softmax层求解输入的待分类图像属于不同类别的概率;
步骤S4:选择待分类图像在不同场景类别下概率最高的类别作为分类器的输出结果,输出结果为待分类图像所属的场景类别。
在一种实施方式中,步骤S1具体包括:
步骤S1.1:对常微分方程(1)进行离散化,得到公式(2)和(3)
yk+1=hf(yk+1)+yk (3)
其中,h表示步长,k表示迭代次数,f(yk+1)为隐函数;
步骤S1.2:隐函数f(yk+1)通过神经网络学习得到参数,构造神经网络,其中,yk为特征提取模块中第k次迭代的输入,yk+1为第k次迭代的输出。
在一种实施方式中,步骤S2具体包括:
步骤S2.1:获取训练数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910745244.5/2.html,转载请声明来源钻瓜专利网。