[发明专利]一种面向嵌入式深度学习的超大尺寸图像目标检测方法及系统有效
申请号: | 202010003131.0 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111191730B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 程陶然;白林亭;文鹏程;高泽;邹昌昊;李欣瑶 | 申请(专利权)人: | 中国航空工业集团公司西安航空计算技术研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/26;G06T7/11 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 胡乐 |
地址: | 710065 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 嵌入式 深度 学习 超大 尺寸 图像 目标 检测 方法 系统 | ||
本发明提出了一种面向嵌入式深度学习的超大尺寸图像目标检测方法及系统,包括:图像预处理单元、目标检测单元、图像后处理单元。本发明提出的面向嵌入式深度学习的超大尺寸图像目标检测方法,面向嵌入式深度学习领域越来越多的超大尺寸图像处理需求,针对嵌入式多核处理器运行深度神经网络的局限性,基于分块思想将单幅图像分割为多幅图像,从而实现单幅图像的并行化目标检测,再通过图像后处理单元对检测结果进行分析,将多幅检测结果融为一体,有效解决嵌入式计算平台处理效率低下的问题。
技术领域
本发明属于智能计算领域,涉及一种面向嵌入式深度学习的超大尺寸图像目标检测方法。
背景技术
随着深度学习技术的不断发展,目标检测、语义分割等基于深度学习的图像处理算法取得了巨大的成功。然而,由于深度神经网络结构复杂、参数众多,使得深度学习算法在资源有限的嵌入式计算平台上表现很差,往往只能处理一些小型图像。对于大尺寸的遥感图像或者富含细节信息的高清图像,嵌入式深度学习算法处理效率十分低下。
为了提升嵌入式深度学习算法的处理效率,硬件厂商先后推出多款AI芯片,通过在硬件层面优化计算结构提高处理速度,并通过多核技术提高数据吞吐量。然而,由于深度神经网络的高度互联性,增加了算法模型处理单幅图像的并行化计算难度。面向流媒体数据的实时处理要求,难以充分利用多核处理器的并行计算能力。
发明内容
本发明提出了一种面向嵌入式深度学习的超大尺寸图像目标检测方法,旨在实时高效处理超大尺寸图像数据,完成目标的全面、准确检测。
本发明提出的解决方案如下:
该面向嵌入式深度学习的超大尺寸图像目标检测方法,包括:
1)接收输入图像,按照像素点位置将图像分割为多个子图像,其中任意一个子图像均与其相邻的所有子图像在靠近边界的区域互相重叠,该区域记为分割冗余区域;
2)分别对每个子图像进行目标检测,得到目标相关信息(目标检测结果);
3)参考得到的各个子图像的目标相关信息,对分割冗余区域的目标重新检测定位;根据更新后的目标检测结果在原始图像上标记,输出可视化结果。
基于以上方案,本发明还进一步做了如下优化:
可选地,步骤1)具体是根据预设的宽度W、高度H、冗余阈值T进行图像分割;所述冗余阈值T表征所述在靠近边界的区域互相重叠的像素数;步骤2)具体是基于卷积神经网络算法分别对大小为W×H的子图像进行目标检测,输出目标相关信息,所述目标相关信息至少包括目标位置。
可选地,所述目标相关信息还包括所属类别和置信度。
可选地,所述宽度W、高度H和冗余阈值T,是根据原始图像尺寸、目标尺寸和处理器计算能力来确定;
分割图像宽度范围为[0,W-1]、[W-T,2W-T-1]、[2W-2T,3W-2T-1]……;
分割图像高度范围为[0,H-1]、[H-T,2H-T-1]、[2H-2T,3H-2T-1]……;
任一宽度范围和高度范围共同组成子图像区域。
可选地,步骤3)具体包括:
分析各个子图像的分割冗余区域是否存在目标回归框,且目标回归框到子图边界的距离小于aT,其中a为设定的系数,较佳的取值范围为0a0.5;
若存在满足以上条件的目标回归框,则以分割冗余区域为中心,重新确定相应的宽度或高度范围,采样大小为W×H的新的子图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司西安航空计算技术研究所,未经中国航空工业集团公司西安航空计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010003131.0/2.html,转载请声明来源钻瓜专利网。