[发明专利]一种图像分类方法和装置在审
| 申请号: | 202310385906.9 | 申请日: | 2023-04-07 |
| 公开(公告)号: | CN116310589A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 姜晗;陈超凡;杨小汕;徐常胜 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/74;G06V10/774;G06V10/80;G06V10/82 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王欢 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 分类 方法 装置 | ||
本申请公开了一种图像分类方法和装置,通过对待分类的图像进行语义引导的注意力权重处理,提取得到属性视觉基元特征和物体视觉基元特征,并基于此,通过图像分类器对其进行处理,得到与该图像对应的目标分类结果。图像分类器中包括细粒度属性原型和细粒度物体原型,每一个所述细粒度属性原型由从对应属性语义特征和物体语义特征组合的图像样本中提取的属性视觉基元特征计算得到,细粒度物体原型同理。基于此,每一个所述属性语义特征或者所述物体语义特征都有与之对应的多个细粒度属性原型或者细粒度物体原型,提升每一个所述属性语义特征和所述物体语义特征的视觉多样性,有利于提升图像分类的准确率。
技术领域
本申请涉及图像识别技术领域,更具体地说,涉及一种图像分类方法和装置。
背景技术
在计算机视觉领域中,图像分类可以学习多个不同语义标签对应的视觉基元特征,并基于待分类图像的视觉基元特征与上述语义标签对应的视觉基元特征进行分类。通常图像所表现的语义信息不只一个,其中可以包括物体信息和属性信息,基于此,可以利用训练好的组合式零样本分类模型,识别图像对应的物体语义标签和属性语义标签。
但是现有技术中,通常一个语义标签只学习一个统一的视觉基元特征,忽略了在不同图像场景下,同一个语义标签所呈现的视觉表现之间的差异性,基于上述缺乏多样性的视觉图像分类,最终得到的图像分类结果也会与图像本身存在较大差异。
发明内容
有鉴于此,本申请提供了一种图像分类方法和装置,用于解决现有图像识别方式中,视觉特征单一的问题。
为了实现上述目的,现提出的方案如下:
一种图像分类方法,包括:
获取待分类图像;
对所述待分类图像进行语义引导的注意力权重处理,得到所述待分类图像的待分类属性视觉基元特征和待分类物体视觉基元特征,所述语义引导的注意力权重处理是基于从训练数据集中提取的属性语义特征和物体语义特征,与所述待分类图像的特征图进行计算得到属性视觉基元特征和物体特征的处理过程;
将所述待分类属性视觉基元特征和所述待分类物体视觉基元特征输入图像分类器进行分类处理,得到与所述待分类图像对应的目标分类结果,所述图像分类器由所述训练数据集中的图像样本,所述图像样本对应的属性语义特征、物体语义特征,以及细粒度属性原型和细粒度物体原型训练得到,使其针对图像的属性视觉基元特征和物体视觉基元特征进行分类,其中,每一个所述细粒度属性原型由从对应属性语义特征和物体语义特征组合的图像样本中提取的属性视觉基元特征计算得到,所述细粒度物体原型由从对应物体语义特征和属性语义特征的图像样本中提取的物体视觉基元特征计算得到。
优选地,该方法还包括:
获取训练数据集,所述训练数据集中包括多个图像样本,每一个所述图像样本包括属性标签和物体标签;
从每一个所述图像样本中提取特征图;
对所述属性标签和所述物体标签进行语义提取处理,得到属性语义特征和物体语义特征;
基于所述属性语义特征和所述物体语义特征的语义相似度,从所述图像样本中选取目标图像进行图像混合,得到新图像样本;
提取所述新图像样本的特征图、属性语义特征和物体语义特征;
将所有的所述图像样本和所述新图像样本的所述特征图、所述属性语义特征和所述物体语义特征进行语义引导的注意力权重处理,得到与每一个所述图像样本或者所述新图像样本对应的属性视觉基元特征和物体视觉基元特征;
基于预设的分类器结构、所述属性视觉基元特征、所述物体视觉基元特征进行训练,得到图像分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310385906.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





