[发明专利]图像处理的方法、装置、计算机可读存储介质有效

专利信息
申请号: 201711378911.8 申请日: 2017-12-19
公开(公告)号: CN109934216B 公开(公告)日: 2021-05-11
发明(设计)人: 顾子晨;龚怡宏;陶小语 申请(专利权)人: 华为技术有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/62
代理公司: 北京龙双利达知识产权代理有限公司 11329 代理人: 范华英;毛威
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 处理 方法 装置 计算机 可读 存储 介质
【说明书】:

本申请提供了一种图像处理的方法和装置。该方法包括:将待检测图像划分为互不重叠的Q个网格,其中,Q为大于1的整数,该Q个网格中的第p个网格属于K(p)个区域,其中,p=1,2,…,Q,K(p)为大于1的整数,该K(p)个区域在该待检测图像上占用的区域不同;针对该K(p)个区域中任意一个区域在高层特征图上截取子特征图,根据特征图对该K(p)个区域内待检测目标进行分类和定位。本申请可以使同一个位置被划分到不同尺度的区域上,这样在高层特征图上可以提取对应该位置的不同尺度的子特征图,使得在该位置提取到的子特征图更加全面和准确,从而能够提高生成的目标候选区域的质量,提升目标检测系统的性能。

技术领域

本申请涉及图像处理领域,并且更具体地,涉及一种图像处理的方法、装置、计算机可读存储介质。

背景技术

目标检测是计算机视觉领域的一项基本任务,旨在识别并定位出图像或视频中感兴趣的目标,在工业界有着非常广泛的应用。目标检测需要识别出图像中出现的属于预定义类别的目标,并以检测框的形式准确地定位每一个目标。因而,目标检测任务主要面临着两方面的挑战:

(1)需要将目标从复杂的背景中区分出来;

(2)需要调优目标的候选框,使他们更加接近目标真实边框,来获取更高的准确度。

随着深度学习的出现,近期的目标检测系统大都基于深度神经网络。现有的卷积神经网络目标检测系统通常分为候选框生成和候选框区域内的目标分类两个阶段。在候选框区域内的目标分类阶段,通常做法是将预训练的卷积网络作为特征提取模块嵌入到目标检测系统中,并在特定的检测任务上进行优化。例如,基于区域的卷积网络加速版(fastregion-based convolutional neural network,Fast R-CNN)目标检测器,将卷积网络嵌入作为特征提取模块,对每个候选区域提取特征并进行分类和定位。

而关于候选区域的生成,业内性能领先的目标检测系统多采用候选区域网络(region proposal network,RPN)来实现。然而,RPN网络在目标判别上存在着一些问题。一方面,RPN仅采用“目标/非目标”二类标签进行训练,学习得到的分类器缺少对复杂特征的判别力,预测时容易将背景误报为目标。另一方面,RPN在卷积神经网络(convolutionalneural network,CNN)的高层特征上采用3×3的滑动窗口提取特征,这会造成较大目标的感受野远小于目标本身的尺度,导致目标信息的丢失。

鉴于上述问题,一些研究工作试图直接将RPN的二类分类层改为多类分类层,但是根据固定的3×3的滑动窗口提取的特征来预测多类目标,效果并不好,因而生成的目标候选区域质量不高,导致目标检测系统性能较差。

发明内容

本申请提供一种图像处理的方法、装置、计算机可读存储介质,能够提高生成的目标候选区域的质量,从而提升目标检测系统的性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711378911.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top