[发明专利]一种图像识别方法、装置、设备及介质在审
申请号: | 202310636712.1 | 申请日: | 2023-05-31 |
公开(公告)号: | CN116486223A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 李皓宇;吕广奕;陈鹏 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V20/52;G06V10/764 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 胡春娇 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 设备 介质 | ||
1.一种图像识别方法,所述方法包括:
获取待识别图像和所述待识别图像对应的目标任务类别;其中,所述目标任务类别为所述待识别图像对应的多个任务类别之一;
基于所述目标任务类别,通过图像识别模型确定所述待识别图像对应的目标图像特征;
根据所述目标图像特征确定所述待识别图像中对应的目标图像区域;其中,所述图像识别模型能够基于不同任务类别,确定所述待识别图像中对应的不同图像区域。
2.根据权利要求1所述的方法,所述基于所述目标任务类别,通过图像识别模型确定所述待识别图像对应的目标图像特征,包括:
将所述待识别图像和所述目标任务类别输入所述图像识别模型;
提取所述待识别图像的第一图像特征,以及,根据预设的任务特征与任务类别的对应关系,从所述图像识别模型所关联的任务特征中确定所述目标任务类别对应的目标任务特征;
对所述目标任务特征和所述第一图像特征进行融合,得到所述待识别图像对应的目标图像特征。
3.根据权利要求2所述的方法,所述图像识别模型为根据多个样本图像、各个所述样本图像的各个标识区域和各个所述标识区域所属的任务类别,对待训练神经网络进行训练得到的,各个所述标识区域所属的任务类别至少包括两个任务类别。
4.根据权利要求3所述的方法,所述图像识别模型的训练方式包括:
将样本图像组的样本图像和所述样本图像的目标标识区域所属的任务类别输入待训练神经网络,其中,所述目标标识区域为所述样本图像中多个不同任务类别的标识区域之一,所述样本图像组包括多个样本图像,所述多个样本图像的各个标识区域所属的任务类别至少包括两个任务类别;
提取所述样本图像的第二图像特征,以及,根据预设的样本任务特征与任务类别的对应关系,确定所述目标标识区域所属的任务类别对应的目标样本任务特征;
对所述目标样本任务特征和所述第二图像特征进行融合,得到所述样本图像对应的融合特征,并基于所述融合特征确定出所述样本图像中的预测图像区域;
基于所述样本图像中的目标标识区域和所述预测图像区域,确定所述待训练神经网络的损失函数;
如果判断所述损失函数收敛,基于所述待训练神经网络得到所述图像识别模型;
如果判断所述损失函数未收敛,调整所述待训练神经网络的参数,获取所述样本图像组中新的样本图像,并返回执行所述将样本图像组的样本图像和所述样本图像的目标标识区域所属的任务类别输入待训练神经网络的步骤。
5.根据权利要求4所述的方法,在所述基于所述样本图像中的目标标识区域和所述预测图像区域,确定所述待训练神经网络的损失函数之前,所述方法还包括:
针对每个样本图像,将该样本图像中每个目标所在的图像区域确定为标识区域,并将每个所述标识区域对应的目标的类型确定为该标识区域所属的任务类型。
6.根据权利要求4所述的方法,所述样本图像中的目标标识区域为所述样本图像的图像前景部分,所述样本图像中的其他标识区域为所述样本图像的图像背景部分。
7.根据权利要求4所述的方法,在基于所述样本图像中的目标标识区域和所述预测图像区域,确定所述待训练神经网络的损失函数之前,所述方法还包括:
将所述融合特征确定为所述目标标识区域所属的任务类别所对应的样本任务特征。
8.一种图像识别装置,所述装置包括:
图像获取模块,用于获取待识别图像和所述待识别图像对应的目标任务类别;其中,所述目标任务类别为所述待识别图像对应的多个任务类别之一;
图像特征确定模块,用于基于所述目标任务类别,通过图像识别模型确定所述待识别图像对应的目标图像特征;
图像识别模块,用于根据所述目标图像特征确定所述待识别图像中对应的目标图像区域;其中,所述图像识别模型能够基于不同任务类别,确定所述待识别图像中对应的不同图像区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310636712.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种丁酸梭菌及其在畜禽养殖中的应用
- 下一篇:一种局部放电检测装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序