[发明专利]一种识别图像中对象的类型预测方法、装置及电子设备有效

专利信息
申请号: 201710089723.7 申请日: 2017-02-20
公开(公告)号: CN108460389B 公开(公告)日: 2021-12-03
发明(设计)人: 潘攀;刘巍;李敏;张迎亚;华先胜 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06K9/46 分类号: G06K9/46;G06K9/62
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 李辉
地址: 英属开曼*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 识别 图像 对象 类型 预测 方法 装置 电子设备
【说明书】:

本申请提供一种识别图像中对象的类型预测方法、装置及电子设备。所述方法包括:采用基于全图的特征数据识别图像中对象的类型预测方法对待处理图像进行处理,获取第一类型预测结果;采用基于图像中主体区域的特征数据识别图像中对象的类型预测方法对待处理图像进行处理,获取第二类型预测结果;比较所述待处理图像的第一类型预测结果第一类型预测结果与所述第二类型预测结果是否匹配;若匹配,则将所述第一类型预测结果或所述第二类型预测结果确定为所述待处理图像中的对象的类型。利用本申请各个实施例,结合全图和主体区域检测方式,可以更加准确的识别出图像中的对象,使图像中对象类型的预测结果更加准确,提高识别图像中对象的类型预测精度。

技术领域

本申请属于图像识别处理技术领域,尤其涉及一种识别图像中对象的类型预测方法、装置及电子设备。

背景技术

随着互联网技术的发展,用户不仅可以通过关键字的方式进行搜索,还可以通过图片的方式进行搜索。在通过图片进行搜索的场景中,用户可以通过图库中选择或即时拍摄图片上传至系统。在获取用户上传的图片之后,系统对图片进行分析,识别图片中的对象(人或物品等),以确定图片所属的分类信息,并根据图片的分类信息和特征进行搜索并将搜索结果返回给用户。

目前,识别图片中的物品以预测图片所属类型的方式主要有两种方式,一种方式是基于全图的特征数据识别图片中对象,输出图片的类型标签,另一种方式是利用物体检测技术确定图片中的主体区域,识别出主体区域中的对象,以主体区域中对象的类型标签作为识别出的整个图片的类型。其中,基于全图的特征数据识别处理的过程主体包括:提取待处理图片的视觉特征,例如方向梯度直方图(Histogram of Oriented Gradient,HOG)特征、尺度不变特征变换(Scale-invariant feature transform,SIFT)等,然后通过对应的分类器例如SVM(Support Vector Machine,支持向量机)以生成待处理图片的类型标签。基于物体检测技术对识别处理的过程主要包括:对全图进行主体区域检测,以确定出全图中的主体区域,并提取主体区域对应的特征,并根据主体区域的特征确定出主体区域的类型标签。

然而,上述识别图片中的物品以预测图片所属类型的方式存在以下问题:(1)基于全图特征数据的处理方式,由于对全图进行分析,不可避免会引入背景信息,引入的背景信息会干扰图片中目标主体的识别,导致整个图片分类结果的准确性降低,尤其在目标主体在全图面积占比较小时,引入的背景信息对预测结果影响更大。(2)基于主体区域的处理方式中,仅对主体区域进行分析,识别出主体区域中的物品等。由于主体区域中通常不包含图片的场景信息和上下文信息,在主体区域中的目标主体的形状、颜色等特征比较相近时,无法准确预测出主体区域中的目标主体的类型标签。并且检测主体区域算法本身存在一定的误检率,基于检测区域的方式会将这部分的损失引入类型预测结果中,进一步降低图片中对象的类型预测精度。

发明内容

本申请目的在于提供一种识别图像中对象的类型预测方法、装置及电子设备,结合全图和主体区域检测方式,可以更加准确的识别出图像中的对象,使图像中对象类型的预测结果更加准确,提高识别图像中对象的类型预测精度。

本申请提供的一种识别图像中对象的类型预测方法、装置及电子设备是这样实现的:

一种识别图像中对象的类型预测方法,所述方法包括:

采用全图识别方法对待处理图像进行处理,获取所述待处理图像中的对象的第一类型预测结果,所述全图识别方法基于全图的特征数据识别图像中对象;

采用特征识别方法对所述待处理图像的主体区域进行处理,获取所述主体区域中的对象的第二类型预测结果,所述特征识别方法基于图像中主体区域的特征数据识别图像中对象;

比较所述第一类型预测结果与所述第二类型预测结果是否匹配;

若所述比较的结果为匹配,则将所述第一类型预测结果或所述第二类型预测结果确定为所述待处理图像中的对象的类型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710089723.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top