[发明专利]目标检测方法在审
申请号: | 202210009182.3 | 申请日: | 2022-01-06 |
公开(公告)号: | CN114332734A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 马玉辉;肖保臣;孙运;郭子瑜;李学伟;李军;郎公福 | 申请(专利权)人: | 齐鲁空天信息研究院 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 张博 |
地址: | 250100 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 | ||
本发明公开了一种目标检测方法,包括:对目标视频进行预处理,将目标视频分成K个等长的视频单元;将视频单元切分成连续的视频帧,并对视频帧进行稀疏采样,得到视频帧的RGB图像;根据连续的RGB图像生成三组热图;通过置信度分数从三组热图上分别选取N个左上角点、右下角点和中心关键点;通过计算左上角点和右下角点的嵌入向量距离来判断左上角点和右下角点是否属于同一个物体;在检测到属于同一个物体后,通过计算左上角点和右下角点的偏移量来筛选目标边界框;通过检测目标边界框中的中心关键点来确定是否保留目标边界框;输出保留的目标边界框的坐标信息和目标类别。
技术领域
本发明涉及计算机图形与图像处理领域,具体涉及一种目标检测方法。
背景技术
近年来,计算机图形与图像处理技术在多个领域得到了快速发展,在公安警务工作中体现更为明显,为重大安保、交通管理、巡逻防控等警务实战提供了时空资源服务,成为公安警务在城市管理中的创新应用。随着无人机航拍技术的普及和广泛应用,海量的视频数据给人工识别带来了巨大压力,采用人工模式对视频数据进行分析研判,警务人员的人力、经验和分析能力瓶颈制约了智慧警务应用建设的整体效能。
目前,目标检测的一个共同组成部分是多个锚点边界框,它们是包含各种尺寸和宽高比的矩形框,用作检测的候选框,在要识别的物体上放置预先定义好的锚点边界框,通过ground truth的目标值给出相应的位置。这些方法通常需要大量的锚点来保证预测的边框和ground truth有较高的交并比IoU值,锚点的大小、宽高比都需要提前人为设计好。此外,锚点经常会和ground truth的目标值不一致,大量的锚点边界框只有一小部分才能与ground truth相重叠,这在正负样本之间造成了巨大的不平衡,减慢了训练速度。
现有目标检测方法的主要技术问题包括:
(1)现有技术在无人机航拍这种复杂场景中,由于无人机飞行高度和方向的不确定性,航拍目标易受外部环境和动态背景变化的影响;
(2)当无人机方向发生变化时,待检目标也会发生旋转、放缩和平移等图像变换,难以保证较高的识别准确率;
(3)当无人机高度发生变化时,存在远景目标过小的情况,难以检测到目标的轮廓。
发明内容
为解决现有技术中的上述和其他方面的至少一种技术问题,根据本发明一个方面的实施例,提供一种目标检测方法,包括:
对目标视频进行预处理,将所述目标视频分成K个等长的视频单元, K为大于1的正整数;
将所述视频单元切分成连续的视频帧,并对所述视频帧进行稀疏采样,得到所述视频帧的RGB图像;
根据连续的所述RGB图像生成三组热图,其中,所述三组热图包括:边界框左上角热图、边界框右下角热图、中心热图;
通过置信度分数从三组所述热图上分别选取N个左上角点、右下角点和中心关键点,N为大于1的正整数;
通过计算所述左上角点和所述右下角点的嵌入向量距离来判断所述左上角点和所述右下角点是否属于同一个物体;
在检测到属于所述同一个物体后,通过计算所述左上角点和所述右下角点的偏移量来筛选目标边界框;
通过检测所述目标边界框中的所述中心关键点来确定是否保留所述目标边界框;
输出保留的目标边界框的坐标信息和目标类别。
在本发明的一些实施例中,每组所述热图具有多个通道,每个所述通道是二进制掩码,用于表示所述通道的所述左上角点和所述右下角点的位置,所述左上角点和所述右下角点有一个ground-truth的正值位置,其他位置为负值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁空天信息研究院,未经齐鲁空天信息研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210009182.3/2.html,转载请声明来源钻瓜专利网。