[发明专利]图像处理方法及装置有效
申请号: | 201910441679.0 | 申请日: | 2019-05-24 |
公开(公告)号: | CN110188773B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 黄嘉伟;马宁宁;张祥雨 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/00 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 冯志云;李静波 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 | ||
本发明提供了图像处理方法及装置。其中图像处理方法,包括:图像获取步骤,获取图像;特征提取步骤,根据特征提取方法,提取所述图像的图像特征;图像识别步骤,根据所述图像特征进行图像识别;其中,所述特征提取方法包括:获取特征图步骤,并通过第一尺寸调整步骤、第一卷积步骤、第二尺寸调整步骤对特征图的张量进行变形和卷积,再通过第三尺寸调整步骤、第二卷积步骤、第四尺寸调整步骤进一步对张量进行变形和卷积,最终通过特征提取步骤,得到特征图的特征。本发明提供的图像处理方法及装置通过在卷积神经网络卷积层中,对张量进行变形和组合,降低了卷积计算量,提高了运行效率。
技术领域
本发明一般地涉及图像识别领域,具体涉及一种图像处理方法及装置。
背景技术
随着计算机技术的发展,越来越多的场景需要通过计算机技术来进行如目标检测、目标识别等图像处理工作。其中卷积神经网络(CNN)模型是现代深度视觉识别系统的核心。然而由于卷积网络通常包含巨大的计算量,因此为了将模型应用到移动设备等低功耗场景就必须对其进行化简。在众多的化简策略中,深度可分离卷积(depthwise separableconvolution)是常用的技术之一,它是通过将卷积层分解成深度卷积(depthwiseconvolution)和点卷积(pointwise convolution)的组合,降低模型的计算量。
目前的高效模型结构仍然存在以下问题:1)深度卷积理论上的计算量和参数量很低,但是实际运行中由于其低计算密度的特性导致整体效率并不高;2)组卷积(groupconvolution)作为一种降低计算量参数量的方法,同样由于计算密度低以及高计算碎片的特点,也往往在实际中难以难以达到理想的效率;3)另一些结构中由于存在一些难以优化的操作,比如张量维度重构(dimension shuffle / transpose),成为阻碍算法部署在硬件后实现快速运算的瓶颈。
发明内容
为了解决现有技术中存在的上述问题,本发明的第一方面提供一种特征提取方法,包括:获取特征图步骤,获取特征图,特征图的参数包括特征图批次数量、特征图通道数量、特征图高度以及特征图宽度;第一尺寸调整步骤,将特征图通道数量缩小第一倍数,并将特征图批次数量增大第一倍数,得到第一张量,其中第一倍数为可整除特征图通道数量的正整数;第一卷积步骤,对第一张量进行第一卷积操作,得到第二张量;第二尺寸调整步骤,将第二张量的通道数量增大第一倍数,并将第二张量的批次数量缩小第一倍数,得到第三张量;第三尺寸调整步骤,将第三张量的通道数量缩小第二倍数,并将第三张量的高度或宽度增大第二倍数,得到第四张量,其中第二倍数为可整除第三张量的通道数量的正整数;第二卷积步骤,对第四张量进行第二卷积操作,得到第五张量;第四尺寸调整步骤,将第五张量的通道数量增大第二倍数,并将第五张量的高度或宽度缩小第二倍数,得到第六张量;特征提取步骤,基于第六张量,得到特征图的特征。
在一例中,第一卷积操作采用m*m卷积核进行卷积,其中m≥3。
在一例中,第二卷积操作采用点卷积。
在一例中,第二张量的通道数量为第一张量的通道数量的第三倍数,其中第三倍数为正整数;第五张量的通道数量相比于第四张量的通道数量缩小第三倍数。
在一例中,第一卷积操作共享权重。
在一例中,第二卷积操作共享权重。
本发明的第二方面提供一种图像处理方法,包括:图像获取步骤,获取图像;特征提取步骤,根据如第一方面的特征提取方法,提取图像的图像特征;图像识别步骤,根据图像特征进行图像识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910441679.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序