[发明专利]基于深度学习模型的图像分类识别方法、装置及存储介质在审
申请号: | 202110878767.4 | 申请日: | 2021-08-02 |
公开(公告)号: | CN113610138A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 许欢庆;郭永福 | 申请(专利权)人: | 典基网络科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 杨华 |
地址: | 201208 上海市浦东新区中国(上海)自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 模型 图像 分类 识别 方法 装置 存储 介质 | ||
本发明公开一种基于深度学习模型的图像分类识别方法、装置及存储介质,涉及图像识别技术领域,实行多个品类识别任务共用模型,并保证各任务的分类识别准确率。该方法包括:构建样本集,样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码,品类编码通过增加通道的方式记载;利用深度学习模型训练样本集,得到分类模型;识别阶段,根据识别任务对应的品类,通过增加通道的方式将品类编码插入待测图片中,并基于分类模型识别待测图片输出分类识别结果。该装置应用有上述方案所提的方法。本发明实现了单个模型对多个品类任务的识别功能,保证了各任务的识别准确率,能够对输入的待测图片进行指定品类内的分类。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于深度学习模型的图像分类识别方法、装置及存储介质。
背景技术
近年来,基于深度学习的人工智能技术取得突破性的进展。在图像分类、目标检测、图像分割等应用场景,计算机视觉的处理能力已经接近甚至超过人类。日渐成熟的智能视觉技术在许多实际场景得以运用,也催生了大量新的应用。
很多应用场景包含多个识别任务,分别完成特定品类图像的识别。比如,比较流行的手机应用,提供了狗和花两个品类的精细化分类功能。当用户选择狗品类识别功能时,需要正确识别出照片中狗的细分类别;当用户选择识花功能时,则需要正确识别照片中花的细分类别。通常做法是针对狗和花训练两个独立的识别模型,不同的识别任务调用不同的模型进行分类识别,输出预测结果和预测置信度。目前,基于深度学习的模型具有庞大的参数量,训练输出模型文件很大。图像库ImageNet的1000类,Resnet50模型具有23.5183M个参数,模型输出文件的大小约为97M。一些专为移动端设计和优化的模型(如MobileNet)参数量较小,但加载多个模型对于移动应用来说也是不小的资源负担。一种可行的方法是将多个品类混合,训练一个统一模型。识别阶段,根据任务的不同,对识别结果进行过滤,仅保留与任务品类相关的细分类和置信度结果。由于模型参数量足够大,单个模型足以满足多个品类的特征捕捉和识别。但是,识别任务的输入图像通常包含多个品类的特征,比如,进行狗品类识别时,输入图片包含狗的同时也可能包含了花,分类模型需要能够根据图片特征的品类倾向程度来预测,一定程度上影响了识别精度。而且,预测结果输出时需要过滤掉其他品类的细分类结果,预测结果的置信度的可用性降低。这种方法虽然减少模型的个数,但降低了识别精度,尤其在需要使用预测置信度的应用场景。
发明内容
本发明的目的在于提供一种基于深度学习模型的图像分类识别方法、装置及存储介质,能够提升深度学习模型分类识别的准确率。
为了实现上述目的,本发明的第一方面提供一种基于深度学习模型的图像分类识别方法,包括:
构建样本集,所述样本集中的样本图片标识有分类标签以及不同识别任务对应的品类编码,所述品类编码通过增加通道的方式记载;
利用深度学习模型训练所述样本集,得到分类模型;
根据识别任务对应的品类编码,通过增加通道的方式将所述品类编码插入待测图片中,并基于所述分类模型识别所述待测图片输出分类识别结果。
优选地,在构建样本集之前还包括:
基于多种识别任务构建编码表,所述编码表中的所述识别任务与所述品类编码一一对应;
基于多个分类标签构建分类标签库,所述分类标签库中各个物体品类的细分类与所述分类标签一一对应。
较佳地,所述品类编码通过增加通道方式记载的方法包括:
将图片的表现形式由三通道数组修改为四通道数组,使得品类编码通过增加的第四通道记载;
所述第四通道对应的通道值为品类编码值。
优选地,所述利用深度学习模型训练所述样本集,得到分类模型的方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于典基网络科技(上海)有限公司,未经典基网络科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110878767.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序