[发明专利]图像处理方法、模型训练方法、装置、设备及介质在审
| 申请号: | 202210358363.7 | 申请日: | 2022-04-06 |
| 公开(公告)号: | CN114693977A | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 刘阿建;谭资昌;郭国栋 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 处理 方法 模型 训练 装置 设备 介质 | ||
1.一种图像处理方法,包括:
将待处理图像划分为多个图像块;
基于所述多个图像块中的每一者的特征信息,确定所述多个图像块中的每一者的模态相关度,其中,每个图像块的模态相关度表示该图像块的特征信息和所述待处理图像的模态类型之间的相关程度;以及
基于所述多个图像块中的每一者的模态相关度,利用所述多个图像块中的至少部分图像块的特征信息来执行针对所述待处理图像的分类。
2.根据权利要求1所述的方法,其中,所述基于所述多个图像块中的每一者的模态相关度,利用所述多个图像块中的至少部分图像块的特征信息来执行针对所述待处理图像的分类包括:
基于所述多个图像块中的每一者的模态相关度,从所述多个图像块中选择一个或多个目标图像块;以及
利用所述一个或多个目标图像块中的每一者的特征信息,执行针对所述待处理图像的分类。
3.根据权利要求2所述的方法,其中,所述基于所述多个图像块中的每一者的模态相关度,从所述多个图像块中选择一个或多个目标图像块包括:
针对所述多个图像块中的每一者,响应于该图像块的模态相关度小于预设阈值,将该图像块确定为目标图像块。
4.根据权利要求1所述的方法,其中,所述基于所述多个图像块中的每一者的模态相关度,利用所述多个图像块中的至少部分图像块的特征信息来执行针对所述待处理图像的分类包括:
计算所述多个图像块中的每一者的特征信息的加权和,其中,每个图像块所对应的权重与该图像块的模态相关度负相关;以及
基于所述加权和,执行针对所述待处理图像的分类。
5.根据权利要求1至4中任意一项所述的方法,其中,所述待处理图像包括针对同一对象的多个模态图像,所述多个模态图像中的每一者的模态类型互不相同,
并且其中,所述利用所述多个图像块中的至少部分图像块的特征信息来执行针对所述待处理图像的分类包括:
针对所述多个模态图像中的每一者,利用该模态图像中的多个图像块中的至少部分图像块的特征信息来确定该模态图像的表示信息;
通过将所述多个模态图像中的每一者的表示信息相融合,得到所述待处理图像的融合信息;以及
基于所述融合信息,执行针对所述待处理图像的分类。
6.根据权利要求1至5中任意一项所述的方法,还包括:
在所述确定所述多个图像块中的每一者的模态相关度之前,针对所述多个图像块中的每一者,通过融合所述多个图像块中的每一者的特征信息,来更新该图像块所对应的特征信息。
7.根据权利要求1至6中任意一项所述的方法,其中,所述多个图像块中的每一者的特征信息包括该图像块的频谱信息。
8.一种图像处理模型的训练方法,所述图像处理模型至少包括模态相关度计算模块、分类信息更新模块和分类预测模块,所述训练方法包括:
将样本图像划分为多个图像块,其中,所述样本图像具有分类标签;
确定所述样本图像所对应的特征序列,其中,所述特征序列包括所述多个图像块中的每一者所对应的特征信息、所述样本图像的模态信息以及所述样本图像的分类信息;
将所述特征序列中的所述多个图像块中的每一者所对应的特征信息和所述模态信息输入所述模态相关度计算模块,以得到所述多个图像块中的每一者的模态相关度;
将所述特征序列中的所述多个图像块中的每一者所对应的特征信息、所述分类信息以及所述多个图像块中的每一者的模态相关度输入所述分类信息更新模块,以得到经过更新的分类信息;
将所述分类信息输入所述分类预测模块,以得到所述样本图像的第一预测分类;以及
基于所述样本图像的所述分类标签和所述第一预测分类,调整所述图像处理模型的参数。
9.根据权利要求8所述的方法,其中,所述图像处理模型还包括特征提取模块,并且其中,所述确定所述样本图像所对应的特征序列包括:
将所述多个图像块中的每一者输入所述特征提取模块,以得到所述样本图像所对应的所述特征序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210358363.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





