[发明专利]图像分类的方法、装置及系统有效
申请号: | 201710087002.2 | 申请日: | 2017-02-17 |
公开(公告)号: | CN108229519B | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 王晓刚;朱烽;李鸿升;欧阳万里 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;王艳春 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 装置 系统 | ||
1.一种图像分类方法,包括:
提取图像的特征图;
从所述特征图生成所述图像的分别用于多个标签的多个基本置信度得分;
根据各所述标签的空间位置之间的关系调节所述基本置信度得分,其中,所述标签的空间位置为所述标签对应的对象在所述图像中的位置;以及
根据经过调节的所述基本置信度得分确定与所述图像对应的描述信息,
其中,根据各所述标签的空间位置之间的关系调节所述基本置信度得分包括:
基于所述特征图确定与每个所述标签的空间位置对应的注意力图,其中,所述注意力图表示与所述注意力图对应的所述标签和所述特征图中特征的相关程度的空间分布;
根据各所述标签的注意力图之间的关系确定与所述多个标签中的每个标签分别对应的约束置信度得分;以及
利用所述约束置信度得分调节所述基本置信度得分。
2.如权利要求1所述的方法,其中,在根据各所述标签的注意力图之间的关系确定与所述多个标签中的每个标签分别对应的约束置信度得分之前,还包括:
对所述特征图中的每个像素位置生成与各所述标签中的每个标签对应的空间置信度得分,所述空间置信度得分包含与所述标签中的每个标签在所述像素位置出现的可能性有关的信息;以及
利用所述空间置信度得分修正所述标签的注意力图。
3.如权利要求1或2所述的方法,基于所述特征图确定与每个所述标签的空间位置对应的注意力图包括:
将所述特征图输入至深度神经网络中的第一卷积层,并利用所述第一卷积层对所述特征图进行卷积操作以及对卷积操作结果进行用于模拟人的注意力特性的归一化操作,获得与各所述标签中的每个标签对应的注意力图。
4.如权利要求3所述的方法,其中,对所述特征图中的每个像素位置生成与各所述标签中的每个标签对应的空间置信度得分包括:
将所述特征图输入至所述深度神经网络中的第二卷积层,并利用所述第二卷积层对所述特征图中的每个像素位置生成与所述标签中的每个标签对应的空间置信度得分。
5.如权利要求4所述的方法,其中,根据各所述标签的注意力图之间的关系确定与所述多个标签中的每个标签分别对应的约束置信度得分包括:
通过利用所述深度神经网络中的第三卷积层对通过所述第一卷积层获得的注意力图进行卷积操作,获得与所述多个标签中的每个标签对应的约束置信度得分。
6.如权利要求5所述的方法,其中,
提取图像的特征图包括:
通过利用所述深度神经网络中的第四卷积层对所述图像进行卷积操作,获得所述图像的特征图;以及
从所述特征图生成所述图像的分别用于多个标签的多个基本置信度得分包括:
通过利用所述深度神经网络中的全连接层来从所述第四卷积层接收所述特征图并对所述特征图进行特征全连接操作,获得与所述图像对应的各所述标签的基本置信度得分。
7.如权利要求6所述的方法,其中,所述深度神经网络通过以下步骤预先训练而得:
通过所述深度神经网络获得训练图像的分类,并根据所获得的分类与所述训练图像的参考分类的差别来调节所述第四卷积层与所述全连接层的参数;
固定所述第四卷积层与所述全连接层的参数,通过所述深度神经网络获得训练图像的分类,并根据所获得的分类与所述训练图像的参考分类的差别来调节所述第一卷积层和所述第二卷积层的参数;
固定所述第一卷积层、所述第二卷积层、所述第四卷积层以及所述全连接层的参数,通过所述深度神经网络获得训练图像的分类,并根据所获得的分类与所述训练图像的参考分类的差别来调节所述第三卷积层的参数;以及
通过所述深度神经网络获得训练图像的分类,并根据所获得的分类与所述训练图像的参考分类的差别来调节所述第一卷积层、所述第二卷积层、所述第三卷积层、所述第四卷积层以及所述全连接层的参数。
8.如权利要求1所述的方法,其中,利用所述约束置信度得分调节所述基本置信度得分包括:
将所述基本置信度得分和所述约束置信度得分进行线性求和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710087002.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于语句的图像检测方法、装置和系统
- 下一篇:从图片中检测物体的方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序