[发明专利]图像的处理方法、装置和非易失性计算机可读存储介质在审
申请号: | 202310246446.1 | 申请日: | 2023-03-10 |
公开(公告)号: | CN116468902A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 潘滢炜;姚霆;李业豪;梅涛 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 张雷;许蓓 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 非易失性 计算机 可读 存储 介质 | ||
1.一种图像的处理方法,包括:
利用机器学习模型中顺序连接的多个特征提取层,提取待处理图像的特征向量,当前特征提取层的处理内核根据上一个特征提取层的处理内核和处理结果确定,所述当前特征提取层为除了第一个特征提取层以外的特征提取层;
根据所述特征向量,处理所述待处理图像。
2.根据权利要求1所述的处理方法,其中,所述当前特征提取层的处理内核通过下面的步骤计算:
根据所述上一个特征提取层的处理结果,估计所述当前特征提取层的处理内核的估计值;
根据所述估计值和所述上一个特征提取层的处理内核,确定所述当前特征提取层的处理内核。
3.根据权利要求1所述的处理方法,其中,所述估计所述当前特征提取层的处理内核的估计值包括:
将所述上一个特征提取层的处理结果中的多个通道分量,划分到多个分组;
根据所述多个分组中的每一个,分别估计所述当前特征提取层的处理内核的多个子估计值;
根据所述多个子估计值,确定所述当前特征提取层的处理内核的估计值。
4.根据权利要求3所述的处理方法,其中,所述将所述上一个特征提取层的处理结果中的多个通道分量,划分到多个分组包括:
对所述上一个特征提取层的处理结果进行下采样处理,以获取下采样结果;
对所述下采样结果的通道维度进行扩展,以获取通道维度扩展结果;
将所述通道维度扩展结果,划分到所述多个分组。
5.根据权利要求3所述的处理方法,其中,所述根据所述多个分组中的每一个,分别估计所述当前特征提取层的处理内核的多个子估计值包括:
利用空间全连接SFC层,分别处理所述多个分组中的每一个,以获取所述多个子估计值。
6.根据权利要求3所述的处理方法,其中,所述根据所述多个子估计值,确定所述当前特征提取层的处理内核的估计值包括:
利用全连接层,处理所述多个子估计值的连接结果,以获取全连接处理结果;
对所述全连接处理结果进行组归一化GN处理,确定所述当前特征提取层的处理内核的估计值。
7.根据权利要求1所述的处理方法,其中,所述多个特征提取层中的每一个包括卷积前馈层,所述卷积前馈层包括卷积层和全连接层。
8.根据权利要求7所述的处理方法,其中,所述卷积层设置在所述全连接层之前。
9.根据权利要求8所述的处理方法,其中,所述特征提取层包括层标准化层,所述卷积层的输出作为所述层标准化层的输入,所述层标准化层的输出作为所述全连接层的输入。
10.根据权利要求7所述的处理方法,其中,所述多个特征提取层包括第一特征提取层和第二特征提取层,第一特征提取层包括注意力机制模块,所述第二特征提取层不包括所述注意力机制模块,所述注意力机制模块的输出为所述第一特征提取层的卷积前馈层的输入,所述第一特征提取层处理的数据的分辨率低于所述第二特征提取层处理的数据的分辨率。
11.根据权利要求10所述的处理方法,其中,所述第二特征提取层设置在所述第一特征提取层之前。
12.根据权利要求7所述的处理方法,其中,所述卷积前馈层的卷积层包括深度卷积层。
13.根据权利要求1~12任一项所述的处理方法,其中,所述根据所述特征向量,处理所述待处理图像包括:
根据所述特征向量,对所述待处理图像进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310246446.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序