[发明专利]一种基于ODE求解器自适应的场景分类方法在审
申请号: | 201910745244.5 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110598746A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 余磊;袁琼雯;何敬伟;罗美露 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 42222 武汉科皓知识产权代理事务所(特殊普通合伙) | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类图像 分类器 神经网络 池化 特征提取模块 场景 分布式特征 输入分类器 场景分类 分类效果 输出结果 样本空间 连接层 求解器 自适应 概率 后向 卷积 求解 维数 映射 逼近 分类 | ||
1.一种基于ODE求解器自适应的场景分类方法,其特征在于,包括:
步骤S1:基于后向欧拉逼近的方法构造神经网络,其中,构造的神经网络包括卷积层、特征提取模块、池化层、全连接层和softmax层;
步骤S2:对构造的神经网络进行训练获得分类器;
步骤S3:将待分类图像输入分类器,通过分类器的卷积层调整维数、特征提取模块提取待分类图像的特征、池化层进行池化操作、全连接层将分布式特征映射到样本空间,最后通过softmax层求解输入的待分类图像属于不同类别的概率;
步骤S4:选择待分类图像在不同场景类别下概率最高的类别作为分类器的输出结果,输出结果为该待分类图像所属的场景类别。
2.如权利要求1所述的方法,其特征在于,步骤S1具体包括:
步骤S1.1:对常微分方程(1)进行离散化,得到公式(2)和(3)
yk+1=hf(yk+1)+yk (3)
其中,h表示步长,k表示迭代次数,f(yk+1)为隐函数;
步骤S1.2:隐函数f(yk+1)通过神经网络学习得到参数,构造神经网络,其中,yk为特征提取模块中第k次迭代的输入,yk+1为第k次迭代的输出。
3.如权利要求1所述的方法,其特征在于,步骤S2具体包括:
步骤S2.1:获取训练数据集;
步骤S2.2:对训练数据集进行增强;
步骤S2.3:利用增强后的训练数据集对神经网络进行训练,获得训练后的神经网络,将其作为分类器。
4.如权利要求1所述的方法,其特征在于,构造的神经网络包括三个卷积层、三个特征提取模块、两个池化层、两个全连接层和一个softmax层,步骤S3具体包括:
步骤S3.1:待分类图像首先通过第一卷积层的卷积操作后,经过第一特征提取模块提取特征后,通过第一池化层进行池化操作,并经过第二卷积层卷积后进入第二特征提取模块,然后通过第二池化层和第三卷积层;
步骤S3.2:通过第三卷积层得到的特征图进入第三特征提取模块后输入到全连接层中,经过两层全连接层之后采用softmax函数对输出值进行概率化,得到图像的类别概率值。
5.如权利要求4所述的方法,其特征在于,经过两层全连接层之后采用softmax函数对输出值进行概率化,得到图像的类别概率值,具体包括:
将待分类图像在通过分类器的计算,经过两层全连接层之后,得到一个L维的向量Y,将Y通过softmax函数进行计算,得到图像的类别概率值,如公式(4)所示:
其中,L表示类别总数,根据公式4对Y进行计算共可得到L个概率值,表示该分类图像分属于在L类中的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910745244.5/1.html,转载请声明来源钻瓜专利网。