[发明专利]用于云联邦的图像中的目标物识别方法及装置在审
| 申请号: | 202011641087.2 | 申请日: | 2020-12-31 | 
| 公开(公告)号: | CN112733686A | 公开(公告)日: | 2021-04-30 | 
| 发明(设计)人: | 程家明;孔繁东;周志祥;彭杨 | 申请(专利权)人: | 武汉兴图新科电子股份有限公司 | 
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 | 
| 代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 张毅 | 
| 地址: | 430000 湖北省武汉市东湖新*** | 国省代码: | 湖北;42 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 用于 联邦 图像 中的 目标 识别 方法 装置 | ||
1.一种用于云联邦的图像中的目标物识别方法,其特征在于,所述用于云联邦的图像中的目标物识别方法包括以下步骤:
对原始图像进行Random-Batch images处理,获得处理后图像;
将所述处理后图像与所述原始图像融合后输入ResNet网络,进行特征提取,获得特征图;
将所述特征图输入到双向特征图金字塔网络中进行深层特征图融合,获得语义表达能力更强的特征图;
将所述语义表达能力更强的特征图输入到区域生成网络中,生成多个候选框;
将所述多个候选框输入到ROIAlign网络层,筛选出感兴趣区域;
将所述感兴趣区域映射到所述语义表达能力更强的特征图上,获得感兴趣区域的特征;
全连接层根据所述感兴趣区域的特征对所述感兴趣区域进行分类、框回归及掩码网络处理,获得所述原始图像的语义分类结果,以识别所述原始图像中的目标物。
2.如权利要求1所述的用于云联邦的图像中的目标物识别方法,其特征在于,所述对原始图像进行Random-Batch images处理,获得处理后图像,包括:
对所述原始图像中的每张图像,每次随机截取1/4的含有目标物的图像,将四张所述1/4的含有目标物的图像进行随机拼接,获得处理后图像。
3.如权利要求1所述的用于云联邦的图像中的目标物识别方法,其特征在于,在所述全连接层根据所述感兴趣区域的特征对所述感兴趣区域进行分类、框回归及掩码网络处理,获得所述原始图像的语义分类结果,以识别所述原始图像中的目标物的步骤之前,还包括:
对全连接层中的掩码网络加入通道注意力机制。
4.如权利要求1所述的用于云联邦的图像中的目标物识别方法,其特征在于,所述全连接层根据所述感兴趣区域的特征对所述感兴趣区域进行分类、框回归及掩码网络处理,获得所述原始图像的语义分类结果,以识别所述原始图像中的目标物,包括:
将所述感兴趣区域的特征输入到全连接层,根据所述感兴趣区域的特征对所述感兴趣区域进行分类,得到两个输出;
通过其中一个输出对每个所述感兴趣区域所表示的目标物进行预测,获得目标物预测结果;
通过另一个输出对每个所述感兴趣区域所表示的目标物进行框回归,获得匹配目标物的大小与位置的候选框;
根据所述目标物预测结果和所述候选框,并利用所述掩码网络处理,获得所述原始图像的语义分类结果,以识别所述原始图像中的目标物。
5.如权利要求1所述的用于云联邦的图像中的目标物识别方法,其特征在于,在所述全连接层根据所述感兴趣区域的特征对所述感兴趣区域进行分类、框回归及掩码网络处理,获得所述原始图像的语义分类结果,以识别所述原始图像中的目标物的步骤之后,还包括:
基于所述语义分类结果的准确率对ResNet网络的超参数进行微调,输出所述原始图像的最优语义分类结果。
6.如权利要求5所述的用于云联邦的图像中的目标物识别方法,其特征在于,所述超参数包括:学习率、激活函数和优化器中的至少一种。
7.一种用于云联邦的图像中的目标物识别装置,其特征在于,所述用于云联邦的图像中的目标物识别装置包括:
图像处理模块,用于对原始图像进行Random-Batch images处理,获得处理后图像;
特征提取模块,将所述处理后图像与所述原始图像融合后输入ResNet网络,进行特征提取,获得特征图;
特征融合模块,用于将所述特征图输入到双向特征图金字塔网络中进行深层特征图融合,获得语义表达能力更强的特征图;
感兴趣区域选取模块,用于将所述语义表达能力更强的特征图输入到区域生成网络中,生成多个候选框,并将所述多个候选框输入到ROIAlign网络层,筛选出感兴趣区域;
关联建立模块,用于将所述感兴趣区域映射到所述语义表达能力更强的特征图上,获得感兴趣区域的特征,建立所述感兴趣区域和对应的特征之间的关联信息;
分类模块,用于根据所述关联信息通过全连接层对所述感兴趣区域进行分类、框回归及掩码网络处理,获得所述原始图像的语义分类结果,以识别所述原始图像中的目标物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉兴图新科电子股份有限公司,未经武汉兴图新科电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011641087.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
 - 图像编码/图像解码方法以及图像编码/图像解码装置
 - 图像处理装置、图像形成装置、图像读取装置、图像处理方法
 - 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
 - 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
 - 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
 - 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
 - 图像形成设备、图像形成系统和图像形成方法
 - 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
 - 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
 





