[发明专利]图像处理、模型训练方法、装置、设备、存储介质及程序有效
申请号: | 202210111581.0 | 申请日: | 2022-01-29 |
公开(公告)号: | CN114463584B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王昊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/40;G06V10/80;G06N3/0464 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 李哲;臧建明 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 模型 训练 方法 装置 设备 存储 介质 程序 | ||
1.一种图像处理方法,包括:
获取待处理的第一图像;
对所述第一图像进行特征提取,得到第一图像特征;
根据M种特征增强方式,对所述第一图像特征进行M次特征增强处理,得到M个第二图像特征,所述M为大于或等于1的整数;
对所述M个第二图像特征进行分类处理,得到所述第一图像的类别;
其中,根据M种特征增强方式,对所述第一图像特征进行M次特征增强处理,得到M个第二图像特征,包括:
根据每一特征增强方式,在所述第一图像特征中确定第一子图像特征和第二子图像特征,所述第一子图像特征和所述第二子图像特征是基于卷积处理后的第一图像特征进行通道分解得到;
根据每一特征增强方式,对所述第一子图像特征进行处理,得到目标增强参数;
根据所述目标增强参数对所述第二子图像特征进行特征增强处理,得到每一特征增强方式对应的所述第二图像特征。
2.根据权利要求1所述的方法,其中,根据每一特征增强方式,对所述第一子图像特征进行处理,得到目标增强参数,包括:
在所述第一子图像特征中确定第三子图像特征和第四子图像特征,所述第三子图像特征和所述第四子图像特征是基于对所述第一子图像特征进行通道分解得到;
根据所述特征增强方式对应的位置编码参数,对所述第三子图像特征进行位置编码处理,得到位置矩阵;
对所述第三子图像特征和所述第四子图像特征进行预设运算,得到权重系数矩阵;
根据所述位置矩阵和所述权重系数矩阵,确定所述目标增强参数。
3.根据权利要求2所述的方法,其中,对所述第三子图像特征和所述第四子图像特征进行预设运算,得到权重系数矩阵,包括:
对所述第三子图像特征和所述第四子图像特征进行相乘处理,得到中间融合结果;
利用激活函数对所述中间融合结果进行处理,得到所述权重系数矩阵。
4.根据权利要求1至3任一项所述的方法,其中,所述第一图像特征包括K1个通道对应的通道特征;根据每一特征增强方式,在所述第一图像特征中确定第一子图像特征和第二子图像特征,包括:
根据所述特征增强方式对应的卷积参数对所述第一图像特征进行卷积处理,得到第三图像特征,所述第三图像特征中包括K2个通道对应的通道特征,K2<K1;
对所述第三图像特征进行通道分解处理,得到所述第一子图像特征和所述第二子图像特征。
5.根据权利要求1至3任一项所述的方法,其中,根据所述目标增强参数对所述第二子图像特征进行特征增强处理,得到每一特征增强方式对应的所述第二图像特征,包括:
对所述目标增强参数和所述第二子图像特征进行相乘处理,得到增强图像特征;
对所述增强图像特征进行卷积处理和池化处理,得到所述第二图像特征。
6.根据权利要求1至3任一项所述的方法,其中,对所述第一图像进行特征提取,得到第一图像特征,包括:
对所述第一图像进行卷积处理,得到第1卷积图像,所述第1卷积图像中包括N1个通道;
对第i卷积图像进行通道扩充处理,得到第i+1卷积图像;所述i依次取1、2、…、N,所述第i+1卷积图像包括Ni+1个通道,Ni+1>Ni;
根据所述第N+1卷积图像确定所述第一图像特征。
7.根据权利要求1至3任一项所述的方法,其中,对所述M个第二图像特征进行分类处理,得到所述第一图像的类别,包括:
对所述M个第二图像特征进行融合处理,得到融合图像特征;
对所述融合图像特征进行分类处理,得到所述第一图像为预设类别的概率;
若所述概率大于或者等于预设阈值,则确定所述第一图像的类别为所述预设类别;
若所述概率小于预设概率,则确定所述第一图像的类别为非预设类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210111581.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序