[发明专利]一种基于深度学习的图像场景标注方法有效
申请号: | 201810525276.X | 申请日: | 2018-05-28 |
公开(公告)号: | CN108681752B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 郝玉洁;林劼;陈炳泉;钟德建;杜亚伟;马俊;杨晨 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/776 | 分类号: | G06V10/776;G06V10/82;G06N3/0464 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的图像场景标注方法,包括场景图像数据集,构建卷积神经网络,训练模型,图像标注;所述场景图像数据集,用于训练和测试深度学习场景识别模型;所述构建卷积神经网络,构建用于场景识别的卷积神经网络的模型;所述训练模型,通过训练卷积神经网络,得到场景识别模型;所述图像标注,将模型识别图像得到图像的场景标注词。本发明解决了图像场景标注的不足,解决了图像场景标注的准确率。 | ||
搜索关键词: | 一种 基于 深度 学习 图像 场景 标注 方法 | ||
【主权项】:
1.一种基于深度学习的图像场景识别方法,其特征在于,包括下列步骤:S1.建立场景图像数据集:建立包含丰富场景的图像样本的数据集,其中,每张图像样本都具有准确的场景标注,每个场景类别包含N张图像样本,生成训练图像集;S2.构建卷积神经网络模型:构建由特征提取模块、候选区域生成模块、全局区域得分模块、关键区域选择模块、候选区域调优模块组成的卷积神经网络模型;S3.训练模型:使用其它已训练好的模型参数对卷积神经网络模型的参数进行初始化,采用BP算法和批量梯度下降法利用训练图像集调优模型参数,反复迭代直至求得最小测试误差值的模型参数;S4.图像标注:将待标注的图像输入已训练好的模型,得到图像的场景标注词汇,把词汇写入图像的属性中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810525276.X/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序