[发明专利]图像的处理方法、装置和非易失性计算机可读存储介质在审
申请号: | 202310246446.1 | 申请日: | 2023-03-10 |
公开(公告)号: | CN116468902A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 潘滢炜;姚霆;李业豪;梅涛 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 张雷;许蓓 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 非易失性 计算机 可读 存储 介质 | ||
本公开涉及一种图像的处理方法、装置和非易失性计算机可读存储介质,涉及计算机技术领域。该处理方法,包括:利用机器学习模型中顺序连接的多个特征提取层,提取待处理图像的特征向量,当前特征提取层的处理内核根据上一个特征提取层的处理内核和处理结果确定,当前特征提取层为除了第一个特征提取层以外的特征提取层;根据特征向量,处理待处理图像。本公开的技术方案能够动态学习特征提取层的处理内核,提高特征提取层的识别精度,从而提高处理性能。
技术领域
本公开涉及计算机技术领域,特别涉及一种图像的处理方法、图像的处理装置和非易失性计算机可读存储介质。
背景技术
物体识别技术是计算机视觉领域的基础课题之一。给定一张物体图片和对应的物体类别标签,物体识别的目标是利用这些数据学习一个物体识别生成模型,该模型能够正确分类图像中的物体。物体识别的骨架网络结构设计是该领域的一个重要研究方向。
在相关技术中,物体识别的骨架网络结构主要包括两种设计框架:基于CNN(Convolutional Neural Networks,卷积神经网络)的网络设计和基于Transformer(转换器)模块的网络设计。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:易造成信息丢失,导致处理性能下降。
鉴于此,本公开提出了一种图像的处理技术方案,能够动态学习特征提取层的处理内核,提高特征提取层的识别精度,从而提高处理性能。
根据本公开的一些实施例,提供了一种图像的处理方法,包括:利用机器学习模型中顺序连接的多个特征提取层,提取待处理图像的特征向量,当前特征提取层的处理内核根据上一个特征提取层的处理内核和处理结果确定,当前特征提取层为除了第一个特征提取层以外的特征提取层;根据特征向量,处理待处理图像。
在一些实施例中,当前特征提取层的处理内核通过下面的步骤计算:根据上一个特征提取层的处理结果,估计当前特征提取层的处理内核的估计值;根据估计值和上一个特征提取层的处理内核,确定当前特征提取层的处理内核。
在一些实施例中,估计当前特征提取层的处理内核的估计值包括:将上一个特征提取层的处理结果中的多个通道分量,划分到多个分组;根据多个分组中的每一个,分别估计当前特征提取层的处理内核的多个子估计值;根据多个子估计值,确定当前特征提取层的处理内核的估计值。
在一些实施例中,将上一个特征提取层的处理结果中的多个通道分量,划分到多个分组包括:对上一个特征提取层的处理结果进行下采样处理,以获取下采样结果;对下采样结果的通道维度进行扩展,以获取通道维度扩展结果;将通道维度扩展结果,划分到多个分组。
在一些实施例中,根据多个分组中的每一个,分别估计当前特征提取层的处理内核的多个子估计值包括:利用SFC(Space Full Connection,空间全连接)层,分别处理多个分组中的每一个,以获取多个子估计值。
在一些实施例中,根据多个子估计值,确定当前特征提取层的处理内核的估计值包括:利用全连接层,处理多个子估计值的连接结果,以获取全连接处理结果;对全连接处理结果进行GN(Group Normalization,组归一化)处理,确定当前特征提取层的处理内核的估计值
在一些实施例中,多个特征提取层中的每一个包括卷积前馈层,卷积前馈层包括卷积层和全连接层。
在一些实施例中,卷积层设置在全连接层之前。
在一些实施例中,特征提取层包括层标准化层,卷积层的输出作为层标准化层的输入,层标准化层的输出作为全连接层的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310246446.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序