[发明专利]图像处理方法、装置、计算机可读介质及电子设备有效
申请号: | 201810588686.9 | 申请日: | 2018-06-08 |
公开(公告)号: | CN110163215B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 陈卫东;吴保元;刘威 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/82;G06N3/04 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 计算机 可读 介质 电子设备 | ||
本发明的实施例提供了一种图像处理方法、装置、计算机可读介质及电子设备。该图像处理方法包括:获取待处理的目标图像;基于残差网络对所述目标图像进行特征提取,得到图像特征信息,所述残差网络包含顺次相连的多个残差块,每个所述残差块包含卷积分支和残差分支,所述卷积分支中的第一卷积层的卷积核大小小于位于所述第一卷积层之后的第二卷积层的卷积核大小,所述第二卷积层的卷积步长大于所述第一卷积层的卷积步长且小于所述第二卷积层的卷积核宽度;根据所述图像特征信息对所述待处理图像进行识别处理。本发明实施例的技术方案能够确保图像特征提取的准确性,提高了图像识别的准确率。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种图像处理方法、装置、计算机可读介质及电子设备。
背景技术
ResNet(Residual Neural Network,残差神经网络)是由何凯明等人提出的神经网络,ResNet的结构可以极快地加速超深神经网络的训练,模型的准确率也有非常大的提升。在图像处理领域,如何能够通过ResNet网络来实现最优的图像处理效果是目前亟待解决的技术问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种图像处理方法、装置、计算机可读介质及电子设备,进而至少在一定程度上确保残差网络能够从图像中提取出准确的图像特征,提高图像的识别准确率。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的一个方面,提供了一种图像处理方法,包括:获取待处理的目标图像;基于残差网络对所述目标图像进行特征提取,得到图像特征信息,所述残差网络包含顺次相连的多个残差块,每个所述残差块包含卷积分支和残差分支,所述卷积分支中的第一卷积层的卷积核大小小于位于所述第一卷积层之后的第二卷积层的卷积核大小,所述第二卷积层的卷积步长大于所述第一卷积层的卷积步长且小于所述第二卷积层的卷积核宽度;根据所述图像特征信息对所述待处理图像进行识别处理。
根据本发明实施例的一个方面,提供了一种图像处理装置,包括:第一获取单元,用于获取待处理的目标图像;第一处理单元,用于基于残差网络对所述目标图像进行特征提取,得到图像特征信息,所述残差网络包含顺次相连的多个残差块,每个所述残差块包含卷积分支和残差分支,所述卷积分支中的第一卷积层的卷积核大小小于位于所述第一卷积层之后的第二卷积层的卷积核大小,所述第二卷积层的卷积步长大于所述第一卷积层的卷积步长且小于所述第二卷积层的卷积核宽度;第二处理单元,用于根据所述图像特征信息对所述待处理图像进行识别处理。
在本发明的一些实施例中,基于前述方案,所述残差网络还包含位于所述多个残差块之前的初始卷积层,所述初始卷积层的输出作为所述多个残差块中第一个残差块的输入。
在本发明的一些实施例中,基于前述方案,所述多个残差块构成多个卷积阶段,每个所述卷积阶段中的第一个残差块包含的所述残差分支包含顺次相连的一批量归一化处理层和一目标卷积层。
在本发明的一些实施例中,基于前述方案,所述卷积分支还包括第三卷积层,所述第一卷积层、所述第二卷积层和所述第三卷积层顺次相连;其中,所述第一卷积层和所述第三卷积层的卷积核大小为1×1、卷积步长为1;所述第二卷积层的卷积核大小为3×3、卷积步长为2。
在本发明的一些实施例中,基于前述方案,所述第一卷积层、所述第二卷积层和所述第三卷积层中的每个卷积层之前均设置有一批量归一化处理层。
在本发明的一些实施例中,基于前述方案,所述的图像处理装置还包括:初始化单元,用于初始化所述残差网络;训练单元,用于将训练图像样本输入所述残差网络进行迭代训练,直至所述残差网络的损失函数满足收敛条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810588686.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序