[发明专利]图像处理的方法、装置、计算机可读存储介质有效

申请号：	201711378911.8	申请日：	2017-12-19
公开（公告）号：	CN109934216B	公开（公告）日：	2021-05-11
发明（设计）人：	顾子晨;龚怡宏;陶小语	申请（专利权）人：	华为技术有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/62
代理公司：	北京龙双利达知识产权代理有限公司 11329	代理人：	范华英;毛威
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图像处理方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种图像处理的方法和装置。该方法包括：将待检测图像划分为互不重叠的Q个网格，其中，Q为大于1的整数，该Q个网格中的第p个网格属于K(p)个区域，其中，p＝1，2，…，Q，K(p)为大于1的整数，该K(p)个区域在该待检测图像上占用的区域不同；针对该K(p)个区域中任意一个区域在高层特征图上截取子特征图，根据特征图对该K(p)个区域内待检测目标进行分类和定位。本申请可以使同一个位置被划分到不同尺度的区域上，这样在高层特征图上可以提取对应该位置的不同尺度的子特征图，使得在该位置提取到的子特征图更加全面和准确，从而能够提高生成的目标候选区域的质量，提升目标检测系统的性能。

技术领域

本申请涉及图像处理领域，并且更具体地，涉及一种图像处理的方法、装置、计算机可读存储介质。

背景技术

目标检测是计算机视觉领域的一项基本任务，旨在识别并定位出图像或视频中感兴趣的目标，在工业界有着非常广泛的应用。目标检测需要识别出图像中出现的属于预定义类别的目标，并以检测框的形式准确地定位每一个目标。因而，目标检测任务主要面临着两方面的挑战：

(1)需要将目标从复杂的背景中区分出来；

(2)需要调优目标的候选框，使他们更加接近目标真实边框，来获取更高的准确度。

随着深度学习的出现，近期的目标检测系统大都基于深度神经网络。现有的卷积神经网络目标检测系统通常分为候选框生成和候选框区域内的目标分类两个阶段。在候选框区域内的目标分类阶段，通常做法是将预训练的卷积网络作为特征提取模块嵌入到目标检测系统中，并在特定的检测任务上进行优化。例如，基于区域的卷积网络加速版(fastregion-based convolutional neural network，Fast R-CNN)目标检测器，将卷积网络嵌入作为特征提取模块，对每个候选区域提取特征并进行分类和定位。

而关于候选区域的生成，业内性能领先的目标检测系统多采用候选区域网络(region proposal network，RPN)来实现。然而，RPN网络在目标判别上存在着一些问题。一方面，RPN仅采用“目标/非目标”二类标签进行训练，学习得到的分类器缺少对复杂特征的判别力，预测时容易将背景误报为目标。另一方面，RPN在卷积神经网络(convolutionalneural network，CNN)的高层特征上采用3×3的滑动窗口提取特征，这会造成较大目标的感受野远小于目标本身的尺度，导致目标信息的丢失。

鉴于上述问题，一些研究工作试图直接将RPN的二类分类层改为多类分类层，但是根据固定的3×3的滑动窗口提取的特征来预测多类目标，效果并不好，因而生成的目标候选区域质量不高，导致目标检测系统性能较差。

发明内容

本申请提供一种图像处理的方法、装置、计算机可读存储介质，能够提高生成的目标候选区域的质量，从而提升目标检测系统的性能。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711378911.8/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]图像处理的方法、装置、计算机可读存储介质有效

专利文献下载