[发明专利]基于卷积神经网络的图像处理方法、装置及存储介质有效
申请号: | 201911399345.8 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111179175B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 郭闯世;邵新庆;刘强;徐明 | 申请(专利权)人: | 深圳力维智联技术有限公司;南京中兴力维软件有限公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06N3/0464 |
代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 邹新华 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 图像 处理 方法 装置 存储 介质 | ||
本发明公开了一种基于卷积神经网络的图像处理方法、装置及存储介质,该基于卷积神经网络的图像处理方法包括以下步骤:获取一组图像集合;其中,所述图像集合内包括同一原始图像的不同尺寸的图像;将所述图像集合中的每张图像分别输入第一卷积层中对应的卷积处理支路,以获得每张图像的特征图;对各张所述特征图进行合并处理,以获得所述图像集合对应的目标特征图,并将所述目标特征图输入第二卷积层。本发明的技术方案,旨在减少图像处理过程的计算量,提升网络性能。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于卷积神经网络的图像处理方法、装置及存储介质。
背景技术
三阶段级联架构的MTCNN(Multi-task convolutional neural network,多任务卷积神经网络)在人脸检测上有着领先性的优势,其包括Proposal Network(全卷积网络,P-Net),Refine Network(R-Net)以及Output Network(O-Net)。其中P-Net主要用于获得人脸区域的候选窗口和边界框的回归向量,并用该边界框做回归,对候选窗口进行校准,然后通过非极大值抑制来合并高度重叠的候选框。R-Net是通过边界框回归和NMS来去掉那些预测错误的区域。O-Net比R-Net多了一层卷积层,作用和R-Net层作用一样,通过边界框回归和NMS来去掉那些预测错误的区域。
为了适应图片中不同尺度的人脸,网络的输入是一个金字塔图像,即将原图像按照设定的放缩因子p,以p,p2,p3,p4……的比例逐渐缩小,生成一个金字塔图像,最后获得的最小图像的最短边大于或者等于12。其中,原图像的尺度越大,检测到的人脸尺度越小,原图像的尺度越小,检测到的人脸尺度越大,保证了对不同尺度人脸的检测准确性。但是随着图像尺度的增大,金字塔图像的层数也会增加,导致计算量随之增加。
发明内容
本发明通过提供一种基于卷积神经网络的图像处理方法、装置及存储介质,旨在减少图像处理过程的计算量,提升网络性能。
为实现上述目的,本发明提供一种基于卷积神经网络的图像处理方法,所述基于卷积神经网络的图像处理方法包括以下步骤:
获取一组图像集合;其中,所述图像集合内包括同一原始图像的不同尺寸的图像;
将所述图像集合中的每张图像分别输入第一卷积层中对应的卷积处理支路,以获得每张图像的特征图;
对各张所述特征图进行合并处理,以获得所述图像集合对应的目标特征图,并将所述目标特征图输入第二卷积层。
可选的,所述将所述图像集合中的每张图像分别输入第一卷积层中对应的卷积处理支路,以获得每张图像的特征图的步骤包括:
获取所述图像集合中每张图像的尺寸信息;
确定第一卷积层中与所述尺寸信息对应的卷积处理支路;
将每张图像输入所确定的所述卷积处理支路,以获得每张图像的特征图。
可选的,所述对各张所述特征图进行合并处理,以获得所述图像集合对应的目标特征图的步骤包括:
将每张所述图像的特征图进行合并处理,以获得初始特征图;
将所述初始特征图输入预设的激活函数,以生成所述图像集合对应的目标特征图。
可选的,所述获取一组图像集合的步骤之前,还包括:
获取所述原始图像的多张不同尺寸的图像;
对多张所述不同尺寸的图像进行分组处理,以获得多组图像集合。
可选的,所述对多张所述不同尺寸的图像进行分组处理,以获得多组图像集合的步骤之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳力维智联技术有限公司;南京中兴力维软件有限公司,未经深圳力维智联技术有限公司;南京中兴力维软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911399345.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序