[发明专利]图像处理方法、深度学习模型的训练方法及装置有效
申请号: | 202310271054.0 | 申请日: | 2023-03-16 |
公开(公告)号: | CN116206131B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 黄军;杜宇宁 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/82;G06N3/08;G06V40/20;G06N3/0464 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 张琛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 深度 学习 模型 训练 装置 | ||
1.一种图像处理方法,包括:
针对待处理图像序列中的任意一个待处理图像,利用目标深度学习模型的至少一个第一网络对所述待处理图像进行处理,得到第一图像特征,其中,所述第一图像特征具有时序维度,所述目标深度学习模型还包括至少一个第二网络;
利用所述第二网络的时序注意力子网络对所述第一图像特征进行处理,得到时序注意力特征,其中,所述时序注意力特征表征所述时序维度的全局注意力概率;
根据所述全局注意力概率,确定至少一个目标时序,其中,将全局注意力概率具有更高概率数值的时序确定为目标时序;
利用所述第二网络的时序位移子网络对对应所述目标时序的所述第一图像特征进行时序位移操作,得到第二图像特征;以及
根据所述第二图像特征,确定所述待处理图像的图像处理结果。
2.根据权利要求1所述的方法,其中,所述根据所述第二图像特征,确定所述待处理图像的图像处理结果包括:
对所述第二图像特征进行分类处理,得到所述待处理图像的图像处理结果。
3.根据权利要求1所述的方法,其中,所述根据所述第二图像特征,确定所述待处理图像的图像处理结果包括:
根据至少一个所述第一网络对所述第二图像特征进行处理,得到第三图像特征;
对所述第三图像特征进行分类处理,得到所述待处理图像的图像处理结果。
4.根据权利要求1-3中任一项所述的方法,其中,与多个待处理视频片段的序列对应的所述待处理图像序列是从所述多个待处理视频片段中抽取视频帧得到的,所述多个待处理视频片段是对待处理视频进行视频分段得到的。
5.一种深度学习模型的训练方法,包括:
针对训练图像序列的任意一个训练图像,利用深度学习模型的至少一个第一网络对所述训练图像进行处理,得到第一图像特征,其中,所述第一图像特征具有时序维度,所述深度学习模型还包括至少一个第二网络;
利用所述第二网络的时序注意力子网络对所述第一图像特征进行处理,得到时序注意力特征,其中,所述时序注意力特征表征所述时序维度的全局注意力概率;
根据所述全局注意力概率,确定至少一个目标时序,其中,将全局注意力概率具有更高概率数值的时序确定为目标时序;
利用所述第二网络的时序位移子网络对对应所述目标时序的所述第一图像特征进行时序位移操作,得到第二图像特征;
根据所述第二图像特征,确定所述训练图像的输出结果;
根据所述输出结果和损失函数,确定反馈数值;以及
根据所述反馈数值调整所述深度学习模型的模型参数,得到目标深度学习模型。
6.根据权利要求5所述的方法,其中,所述根据所述第二图像特征,确定所述训练图像的输出结果包括:
对所述第二图像特征进行分类处理,得到所述训练图像的输出结果。
7.根据权利要求5所述的方法,其中,所述根据所述第二图像特征,确定所述训练图像的输出结果包括:
根据至少一个所述第一网络对所述第二图像特征进行处理,得到第三图像特征;
对所述第三图像特征进行分类处理,得到所述训练图像的输出结果。
8.根据权利要求5-7中任一项所述的方法,其中,所述训练图像是对候选训练图像序列中的多个候选训练图像基于像素值进行加权运算得到的。
9.根据权利要求8所述的方法,其中,与多个视频片段的序列对应的所述候选训练图像序列是从多个视频片段中抽取视频帧得到的,所述多个视频片段是对候选视频进行视频分段得到的。
10.根据权利要求5-7中任一项所述的方法,其中,所述深度学习模型是经过预训练得到的预训练深度学习模型。
11.根据权利要求10所述的方法,其中,所述预训练深度学习模型是对初始深度学习模型进行模型蒸馏操作得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310271054.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于DDS的软件化雷达数据流通信方法
- 下一篇:一种美术品颜色着色喷涂器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序