[发明专利]一种具有尺度协调机制的实时视觉目标识别方法有效
申请号: | 201910340918.3 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110211150B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 王鸿鹏;宋玉琳;代婉 | 申请(专利权)人: | 南开大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06T7/246;G06T7/277;G06T7/11;G06V10/25;G06V10/26;G06V10/50;G06V10/56;G06V10/52;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 天津市尚仪知识产权代理事务所(普通合伙) 12217 | 代理人: | 高正方 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种具有尺度协调机制的实时视觉目标识别方法,以目标分割确定待识别主体的大小,协调实时目标跟踪中待识别区域的尺度,从而提高识别精度。该方法首先对采集到的图像按对比度作图像分割,将待识别主体从背景中分割出来以确定待识别主体的大小。此外,在普通的实时视觉目标识别流程中,目标跟踪算法计算出每一帧中跟踪目标主体位置,并将主体位置提供给目标识别算法完成识别。当目标分割后的主体大小与目标跟踪后的主体大小之比高于阈值时,启动尺度协调机制,以目标分割大小为准,调整识别框基于跟踪框的扩大倍数。所提方法能够有效应对目标主体形变、旋转等问题。 | ||
搜索关键词: | 一种 具有 尺度 协调 机制 实时 视觉 目标 识别 方法 | ||
【主权项】:
1.一种具有尺度协调机制的实时视觉目标识别方法,其特征在于,其步骤为:步骤 1:采集图像,输入视频流序列;步骤 2:目标检测,确定首帧感兴趣目标的位置与尺寸;步骤 3:目标跟踪,分别提取目标区域内的 HOG 特征与颜色直方图特征,初始化跟踪器;步骤 4:跟踪框,分别计算相关滤波跟踪器的响应、贝叶斯概率模型跟踪器的响应,将二者进行线性融合,综合响应最大的位置处,为目标的位置估计;引入单独的相关性滤波尺度估计机制,将不同尺度大小图像块统一到固定模板大小,寻找最优尺度估计,根据目标位置和尺度估计做出跟踪框;步骤 5:目标识别,依据目标跟踪估计出的目标位置将待识别目标在原图像中裁剪出来,然后将待识别区域的尺寸归一化到自制数据集训练卷积神经网络CNN中输入尺寸参数,在训练好的 CNN 参数上进行一次前向传播得到推理结果作为识别框输出;步骤 6:目标分割,每一帧图像在目标跟踪更新目标位置的同时,依据对比度分割出图像中的显著区域即为目标区域,在数字图像中通过计算每一个像素与周围的对比度来表示其显著性即属于目标的可能性,显著性越高则越可能属于目标,将显著性较高与较低区域分别以二值图像中的0和1表示,即完成目标分割,做出分割框;步骤 7:尺度更新判定,计算分割框边长 D2 与识别框边长 D1 的比值,当比值大于阈值时,启动尺度协调机制,以目标分割大小为准,调整识别框基于跟踪框的扩大倍数,继续迭代跟踪以及对识别框进行实时识别,使识别框按比例增大为分割框大小;若比值小于阈值,不作任何处理,继续分割下一帧。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910340918.3/,转载请声明来源钻瓜专利网。