[发明专利]一种基于迁移学习的多标签场景图像分类方法及装置在审
申请号: | 202010063643.6 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111275107A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 李安亚 | 申请(专利权)人: | 西安奥卡云数据科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 西安维赛恩专利代理事务所(普通合伙) 61257 | 代理人: | 李明全 |
地址: | 710000 陕西省西安市西咸新区秦*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 标签 场景 图像 分类 方法 装置 | ||
1.一种基于迁移学习的多标签场景图像分类方法,其特征在于,包括:
对待识别场景图像进行归一化处理和降冗处理,得到中间图像;
将所述中间图像输入基于深度迁移学习的神经网络模型,并输出所述待识别场景图像的多个场景分类标签;
其中,所述基于深度迁移学习的神经网络模型包括由卷积神经网络Inception-V3模型中的卷积层和池化层组成的特征提取器,以及训练好的场景图像分类器。
2.如权利要求1所述的一种基于迁移学习的多标签场景图像分类方法,其特征在于,所述基于深度迁移学习的神经网络模型对中间图像进行分类包括:
通过所述特征提取器提取所述中间图像的特征图;其中,所述特征图为表征中间图像中场景间的细微差别特征;
将所述特征图输入到训练好的场景图像分类器,得出所述待识别场景图像的多个分类标签。
3.如权利要求2所述的一种基于迁移学习的多标签场景图像分类方法,其特征在于,所述训练好的场景图像分类器为采用多组训练数据训练得到的,所述多组训练数据中的每组训练数据均包括训练图像的特征图和训练图像的多个真实场景分类标签。
4.如权利要求2或3所述的一种基于迁移学习的多标签场景图像分类方法,其特征在于,所述场景图像分类器的训练方法为:
获取所述多组训练数据;
将每组训练数据中的训练图像的特征图输入到初始化的场景图像分类器中,通过所述场景图像分类器输出所述每组训练数据中的训练图像的多个训练场景分类标签;
根据所述多个训练场景分类标签和多个真实场景分类标签,生成训练好的场景图像分类器。
5.如权利要求4所述的一种基于迁移学习的多标签场景图像分类方法,其特征在于,根据所述多个训练场景分类标签和多个真实场景分类标签,生成训练好的场景图像分类器包括:
求取所述多个训练场景分类标签和多个真实场景分类标签之间的偏差;
根据所述偏差计算反向误差;
通过所述反向误差以及损失函数更新所述场景图像分类器的参数值,直至所述损失函数值小于等于预定阈值,得到训练好的场景图像分类器。
6.如权利要求2所述的一种基于迁移学习的多标签场景图像分类方法,其特征在于,所述特征图为2048维向量。
7.一种基于迁移学习的多标签场景图像分类装置,其特征在于,包括:
处理模块,用于对待识别场景图像进行归一化处理和降冗处理,得到中间图像;
识别输出模块,用于将所述中间图像输入基于深度迁移学习的神经网络模型,并输出所述待识别场景图像的多个场景分类标签;
其中,所述基于深度迁移学习的神经网络模型包括由卷积神经网络Inception-V3模型中的卷积层和池化层组成的特征提取器,以及训练好的场景图像分类器。
8.如权利要求7所述的一种基于迁移学习的多标签场景图像分类装置,其特征在于,所述基于深度迁移学习的神经网络模型对中间图像进行分类包括:
提取模块,用于通过所述特征提取器提取所述中间图像的特征图;其中,所述特征图为表征中间图像中场景间的细微差别特征;
分类模块,用于将所述特征图输入到训练好的场景图像分类器,得出所述待识别场景图像的多个分类标签。
9.一种基于迁移学习的多标签场景图像分类设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安奥卡云数据科技有限公司,未经西安奥卡云数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010063643.6/1.html,转载请声明来源钻瓜专利网。