[发明专利]图像标注模型训练和图像标注方法、系统、设备及介质在审
申请号: | 202110321391.7 | 申请日: | 2021-03-25 |
公开(公告)号: | CN113065013A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 杨凯;罗超;胡泓;李巍 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 杨东明;张冉 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标注 模型 训练 方法 系统 设备 介质 | ||
本发明公开了一种图像标注模型训练和图像标注方法、系统、设备及介质。图像标注模型训练方法包括:获取图像数据并构造训练数据集,训练数据集包括被预设的分类标签标注的图像数据;分类标签包括若干不同的目标标签和一个非目标标签;在残差网络结构包括的卷积层后增加注意力机制模块,以构建图像标注模型,注意力机制模块用于对卷积层输出的特征图的不同通道和区域进行调整,残差网络结构包括依次连接的至少一个卷积层和一个全连接层;将训练数据集输入到图像标注模型进行训练,得到目标图像标注模型。本发明通过在图像分类标签体系中增加非目标标签构造训练数据集,利用残差网络和注意力机制构建图像标注模型,提高了图片标注的准确率。
技术领域
本发明涉及深度学习技术领域,特别涉及一种图像标注模型训练和图像标注方法、系统、设备及介质。
背景技术
随着信息技术的发展,图像信息迎来爆炸式增长。例如以景点分享、推荐为目的的攻略图库,每天都会新增大量由用户或者景点官方上传的图片,图库中积压了海量的杂乱无章的图片,难以进一步利用。仅凭人工处理无法对如此大量的图像数据进行标注,基于深度学习模型的图像分类算法是目前进行海量图片标注的主要方法。但现有的开源图像分类模型针对的是特定窄邻域的图像,在攻略图库等开放场景下,无法对包括海量的无关图片的图像数据进行准确地识别和标注。
发明内容
本发明要解决的技术问题是为了克服现有技术中针对特定窄邻域的图像分类模型无法准确地识别和标注海量包括海量的无关图片的图像数据的缺陷,提供一种图像标注模型训练和图像标注方法、系统、设备及介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供一种图像标注模型训练方法,所述图像标注模型训练方法包括:
获取图像数据并构造训练数据集,所述训练数据集包括被预设的分类标签标注的所述图像数据;所述分类标签包括若干不同的目标标签和一个非目标标签;所述非目标标签与所述目标标签的类别不同;
在残差网络结构包括的卷积层后增加注意力机制模块,以构建图像标注模型,其中,所述注意力机制模块用于对所述卷积层输出的特征图的不同通道和区域进行调整,所述残差网络结构包括依次连接的至少一个卷积层和一个全连接层;
将所述训练数据集输入到所述图像标注模型进行训练,得到目标图像标注模型。
较佳地,所述在残差网络结构包括的卷积层后增加注意力机制模块的步骤包括:
将所述卷积层输出的第一特征图输入到所述注意力机制模块得到注意力权重特征图;
根据所述第一特征图和所述注意力权重特征图确定所述注意力机制模块输出的第二特征图。
较佳地,所述残差网络结构包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层;
所述在残差网络结构包括的卷积层后增加注意力机制模块的步骤包括:
在所述第二卷积层、所述第三卷积层、所述第四卷积层、所述第五卷积层后分别增加一个注意力机制模块。
较佳地,所述将所述训练数据集输入到所述图像标注模型进行训练,得到目标图像标注模型的步骤包括:
将所述训练数据集输入到所述图像标注模型,得到模型输出结果;
根据所述模型输出结果和平衡因子,利用第一损失函数计算所述图像标注模型的错误损失;
所述平衡因子为所述训练数据集中各所述分类标签标注的样本数与所述训练数据集的样本总数的比例。
较佳地,所述将所述训练数据集输入到所述图像标注模型进行训练,得到目标图像标注模型的步骤包括:
根据所述模型输出结果,利用第二损失函数计算所述图像标注模型的约束损失;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110321391.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序