[发明专利]图像处理方法、图像处理装置、计算机设备及存储介质在审
| 申请号: | 202210550511.5 | 申请日: | 2022-05-18 |
| 公开(公告)号: | CN115131651A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 王博;张希;杨峰;高昆仑;娄竞 | 申请(专利权)人: | 国网智能电网研究院有限公司;国网冀北电力有限公司;国网冀北电力有限公司信息通信分公司;国家电网有限公司 |
| 主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/42;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 刘贺秋 |
| 地址: | 102209 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 处理 方法 装置 计算机 设备 存储 介质 | ||
本发明提供一种图像处理方法、图像处理装置、计算机设备及存储介质。图像处理方法包括:获取目标图像,并提取目标图像的目标特征图。将目标特征图输入至特征识别模型组中,对目标特征图执行多次多尺度的多头自注意力变换处理,识别目标特征图中包括的至少一种粒度特征,其中,不同尺度的多头自注意力变换处理用于识别目标特征图在不同特征分辨率下的特征图。基于至少一种粒度特征对应的特征分辨率,对目标图像执行目标图像处理任务。通过本发明,通过对目标图像的目标特征图进行多次多尺度的多头自注意力变换处理,能够提高识别目标特征图中所包括的粒度特征的准确度,进而保障目标图像处理任务能够顺利进行。
技术领域
本发明涉及图像处理领域,具体涉及一种图像处理方法、图像处理装置、计算机设备及存储介质。
背景技术
图像处理是一种利用计算机程序对图像进行分析,进而达到所需结果的技术。随着计算机技术的快速发展,图像处理技术也得到快速发展。随着基于自注意力机制的深度学习模型在自然语言领域取得巨大成就,基于自注意力机制的深度学习模型也逐步应用在图像处理技术领域中,可以通过基于自注意力机制架构的深度神经网络模型实现对多种图像任务的处理。
相关技术中,执行图像任务时,可以基于深度自注意力网络(Transformer)架构的深度神经网络模型对目标特征图的特征图执行目标图像处理任务,进而通过Transformer架构中的多头自注意力模块在固定特征分辨率下对目标特征图进行全局特征识别,完成图像任务。其中,Transformer是一种基于自注意力机制的深度学习模型。
但采用该种方式执行图像任务时,由于是采用单尺度的多头自注意力模块对目标特征图的特征图进行全局特征识别,进而容易导致高分辨率图片所需计算量过大,低分辨率图片部分特征无法被正确识别,从而影响图像任务的顺利进行。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中针对图像特征进行识别时,识别结果准确率低的缺陷,从而提供一种图像处理方法、图像处理装置、计算机设备及存储介质。
根据第一方面,本发明提供一种图像处理方法,所述方法包括:
获取目标图像,并提取所述目标图像的目标特征图;
将所述目标特征图输入至特征识别模型组中,对所述目标特征图执行多次多尺度的多头自注意力变换处理,识别所述目标特征图中包括的至少一种粒度特征,其中,不同尺度的多头自注意力变换处理用于识别所述目标特征图在不同特征分辨率下的特征图;
基于所述至少一种粒度特征对应的特征分辨率,对所述目标图像执行目标图像处理任务。
在该方式中,能够通过预先训练好的特征识别模型组,对目标图像的目标特征图执行多次多尺度的多头自注意力变换处理,提高识别粒度特征的准确性,进而基于识别到的粒度特征对应的特征分辨率对目标图像执行目标图像处理任务,以使目标图像处理任务能够顺利进行,满足目标图像处理任务的处理需求。
结合第一方面,所述特征识别模型组中包括多个相连的特征识别模型,不同特征识别模型用于识别所述目标特征图在不同特征分辨率阈值下的粒度特征,每一个特征识别模型对所述目标特征图执行至少一次多尺度的多头自注意力变换处理;
所述将所述目标特征图输入至特征识别模型组中,对所述目标特征图执行多次多尺度的多头自注意力变换处理,包括:
将所述目标特征图输入至特征识别模型组中,通过所述多个相连的特征识别模型,依次对所述目标特征图执行多次多尺度的多头自注意力变换处理;
其中,每一个特征识别模型对所述目标特征图执行至少一次多尺度的多头自注意力变换处理,不同尺度对应不同的特征分辨率,每一个特征识别模型对应的特征分辨率阈值为识别所述目标特征图的最大特征分辨率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网智能电网研究院有限公司;国网冀北电力有限公司;国网冀北电力有限公司信息通信分公司;国家电网有限公司,未经国网智能电网研究院有限公司;国网冀北电力有限公司;国网冀北电力有限公司信息通信分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210550511.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





