[发明专利]一种识别图像中对象的类型预测方法、装置及电子设备有效
申请号: | 201710089723.7 | 申请日: | 2017-02-20 |
公开(公告)号: | CN108460389B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 潘攀;刘巍;李敏;张迎亚;华先胜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 图像 对象 类型 预测 方法 装置 电子设备 | ||
本申请提供一种识别图像中对象的类型预测方法、装置及电子设备。所述方法包括:采用基于全图的特征数据识别图像中对象的类型预测方法对待处理图像进行处理,获取第一类型预测结果;采用基于图像中主体区域的特征数据识别图像中对象的类型预测方法对待处理图像进行处理,获取第二类型预测结果;比较所述待处理图像的第一类型预测结果第一类型预测结果与所述第二类型预测结果是否匹配;若匹配,则将所述第一类型预测结果或所述第二类型预测结果确定为所述待处理图像中的对象的类型。利用本申请各个实施例,结合全图和主体区域检测方式,可以更加准确的识别出图像中的对象,使图像中对象类型的预测结果更加准确,提高识别图像中对象的类型预测精度。
技术领域
本申请属于图像识别处理技术领域,尤其涉及一种识别图像中对象的类型预测方法、装置及电子设备。
背景技术
随着互联网技术的发展,用户不仅可以通过关键字的方式进行搜索,还可以通过图片的方式进行搜索。在通过图片进行搜索的场景中,用户可以通过图库中选择或即时拍摄图片上传至系统。在获取用户上传的图片之后,系统对图片进行分析,识别图片中的对象(人或物品等),以确定图片所属的分类信息,并根据图片的分类信息和特征进行搜索并将搜索结果返回给用户。
目前,识别图片中的物品以预测图片所属类型的方式主要有两种方式,一种方式是基于全图的特征数据识别图片中对象,输出图片的类型标签,另一种方式是利用物体检测技术确定图片中的主体区域,识别出主体区域中的对象,以主体区域中对象的类型标签作为识别出的整个图片的类型。其中,基于全图的特征数据识别处理的过程主体包括:提取待处理图片的视觉特征,例如方向梯度直方图(Histogram of Oriented Gradient,HOG)特征、尺度不变特征变换(Scale-invariant feature transform,SIFT)等,然后通过对应的分类器例如SVM(Support Vector Machine,支持向量机)以生成待处理图片的类型标签。基于物体检测技术对识别处理的过程主要包括:对全图进行主体区域检测,以确定出全图中的主体区域,并提取主体区域对应的特征,并根据主体区域的特征确定出主体区域的类型标签。
然而,上述识别图片中的物品以预测图片所属类型的方式存在以下问题:(1)基于全图特征数据的处理方式,由于对全图进行分析,不可避免会引入背景信息,引入的背景信息会干扰图片中目标主体的识别,导致整个图片分类结果的准确性降低,尤其在目标主体在全图面积占比较小时,引入的背景信息对预测结果影响更大。(2)基于主体区域的处理方式中,仅对主体区域进行分析,识别出主体区域中的物品等。由于主体区域中通常不包含图片的场景信息和上下文信息,在主体区域中的目标主体的形状、颜色等特征比较相近时,无法准确预测出主体区域中的目标主体的类型标签。并且检测主体区域算法本身存在一定的误检率,基于检测区域的方式会将这部分的损失引入类型预测结果中,进一步降低图片中对象的类型预测精度。
发明内容
本申请目的在于提供一种识别图像中对象的类型预测方法、装置及电子设备,结合全图和主体区域检测方式,可以更加准确的识别出图像中的对象,使图像中对象类型的预测结果更加准确,提高识别图像中对象的类型预测精度。
本申请提供的一种识别图像中对象的类型预测方法、装置及电子设备是这样实现的:
一种识别图像中对象的类型预测方法,所述方法包括:
采用全图识别方法对待处理图像进行处理,获取所述待处理图像中的对象的第一类型预测结果,所述全图识别方法基于全图的特征数据识别图像中对象;
采用特征识别方法对所述待处理图像的主体区域进行处理,获取所述主体区域中的对象的第二类型预测结果,所述特征识别方法基于图像中主体区域的特征数据识别图像中对象;
比较所述第一类型预测结果与所述第二类型预测结果是否匹配;
若所述比较的结果为匹配,则将所述第一类型预测结果或所述第二类型预测结果确定为所述待处理图像中的对象的类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710089723.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:溢油监测仪及其监测方法
- 下一篇:视频处理的方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序