[发明专利]一种基于深度学习的图像场景标注方法有效
申请号: | 201810525276.X | 申请日: | 2018-05-28 |
公开(公告)号: | CN108681752B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 郝玉洁;林劼;陈炳泉;钟德建;杜亚伟;马俊;杨晨 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/776 | 分类号: | G06V10/776;G06V10/82;G06N3/0464 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 场景 标注 方法 | ||
本发明公开了一种基于深度学习的图像场景标注方法,包括场景图像数据集,构建卷积神经网络,训练模型,图像标注;所述场景图像数据集,用于训练和测试深度学习场景识别模型;所述构建卷积神经网络,构建用于场景识别的卷积神经网络的模型;所述训练模型,通过训练卷积神经网络,得到场景识别模型;所述图像标注,将模型识别图像得到图像的场景标注词。本发明解决了图像场景标注的不足,解决了图像场景标注的准确率。
技术领域
本发明涉及人工智能和模式识别技术领域,特别是涉及一种基于深度学习的图像场景识别方法。
背景技术
图像场景识别是机器视觉领域一个重要的研究课题,它的研究目标是使用计算机自动识别和理解图像中的场景信息。随着图像数据在互联网上的传播,各种网站需要处理海量的图像数据,利用计算机对图像进行自动理解和分类,而场景识别技术在这项应用中有着十分重要的角色。
由于场景识别技术的广泛应用前景,该课题一直受到许多研究者进行研究。国外方面,Li Fei-Fei等提出了使用视觉词袋模型与潜在狄利克雷分布模型结合的中层语义方法进行场景识别;Ade Oliva强调了全局特征的重要性,提出使用全局特征进行场景识别的空间信封模型;Laze bnik等人则对传统的视觉词袋模型进行优化,加入空间信息,提出了空间金字塔匹配方法;Bolei Zhou等人尝试用深度学习技术解决场景识别问题,他们使用场景数据集训练的Places-CNN进行场景识别,并且取得了不错的效果。国内方面,江悦等人使用改进的空间金字塔匹配方法进行场景识别;钱夔等人将场景识别技术与机器人技术结合,并且取得了不错的实践效果;任艺等人则对传统的潜在狄利克雷分布模型进行改进,提高了场景识别的效率。
传统的场景识别方法,一般使用底层特征或高层特征,这些的方法的优点简单易行,具有良好的逻辑性,符合人类的直观认知。但是当所要处理的数据达到一定规模,场景分类达到一定数量时,传统的基于底层特征和高层特征就无法表示如此多的场景信息。因此,使用传统方法解决该问题,逐渐面临瓶颈,尤其在大规模数据集上面临着更多问题。
而基于深度学习的方法却十分适合处理这样的问题,深度学习方法的快速发展,正是得益于数据量的激增,因为深度网络一般需要大量的数据的予以训练,形成复杂且强大的网络架构。现有的基于深度学习的图像场景识别技术已经取得了不错的准确率,但是识别精度还有待提升。
发明内容
为了克服现有的技术对图像场景标注准确率不足,本发明提出一种基于深度学习的图像场景识别方法,采用基于最新深度学习网络架构的图像场景识别算法,能够提升图像场景标注识别精度。
具体的,一种基于深度学习的图像场景识别方法,其特征在于,包括下列步骤:
S1.建立场景图像数据集:建立包含丰富场景的图像样本的数据集,其中,每张图像样本都具有准确的场景标注,每个场景类别包含N张图像样本,生成训练图像集;
S2.构建卷积神经网络模型:构建由特征提取模块、候选区域生成模块、全局区域得分模块、关键区域选择模块、候选区域调优模块组成的卷积神经网络模型;
S3.训练模型:使用其它已训练好的模型参数对卷积神经网络模型的参数进行初始化,采用BP算法和批量梯度下降法利用训练图像集调优模型参数,反复迭代直至求得最小测试误差值的模型参数;
S4.图像标注:将待标注的图像输入已训练好的模型,得到图像的场景标注词汇,把词汇写入图像的属性中。
优选地,所述步骤S1包括以下子步骤:
S11.对场景图像样本进行图像预处理,预处理过程包括:数据类型转换、直方图均衡化、归一化、几何校正和锐化;
S12.随机抽取80%图像样本组成训练图像集,用于模型的训练,其余20%图像样本用于模型测试,检测模型对每种场景图像识别的准确率。
优选地,所述步骤S2包括以下子步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810525276.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序