[发明专利]基于动态背景补偿与深度学习的PTZ摄像机运动目标检测与识别方法在审
申请号: | 202010695736.0 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111738211A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 谢家阳;高承醒;于晋;吴均峰;陈积明;史治国 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/246;G06T7/33;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 背景 补偿 深度 学习 ptz 摄像机 运动 目标 检测 识别 方法 | ||
1.一种基于动态背景补偿与深度学习的PTZ摄像机运动目标检测与识别方法,其特征在于,包括以下步骤:
步骤一:提取视频流中前、中、后相邻三帧的关键点特征并进行匹配,根据匹配点集,使用随机采样一致性算法计算单应性矩阵,剔除匹配置信度低的特征点对,然后通过单应性矩阵对前、后两帧图像进行投影变换,与中间帧进行配准;
步骤二:对于配准完的前、中、后三帧,使用三帧差分运动目标检测算法提取候选区域,使用形态学膨胀算子对候选区域进行后处理,结合最小凸包检测对运动目标进行粗定位;
步骤三:将提取出的候选区域及其背景上下文输入到深度卷积神经网络提取特征,然后分别经分类网络与位置回归网络实现目标分类及位置的精细回归。
2.如权利要求1所述的基于动态背景补偿与深度学习的PTZ摄像机运动目标检测与识别方法,其特征在于,所述步骤一中,对前中后三帧视频图像进行图像尺度压缩,对压缩后的视频图像提取ORB特征点,采用非极大值抑制去除聚集的特征点,对处理后的ORB特征点进行ORB特征描述,使用汉明距离进行特征点匹配,匹配后的对应点集为其中i∈{1,2,…,L},L为第m,n帧视频图像中匹配点的对数,为第m帧中第i个特征点的坐标,为剔除不良匹配点,利用随机采样一致性算法由公式(1)计算第m帧与第n帧的单应性矩阵剔除不良匹配点对单应性矩阵计算的影响。
其中通过以上计算过程分别计算第Ik-1帧与第Ik帧的单应性矩阵Hk|k-1和第Ik+1帧与第Ik帧的单应性矩阵Hk|k+1,然后根据公式(1)分别将前后帧(第Ik-1帧与第Ik+1)与中间帧第Ik帧配准,得到配准后的连续三帧Ik|k-1,Ik与Ik|k+1。
3.如权利要求1所述的基于动态背景补偿与深度学习的PTZ摄像机运动目标检测与识别方法,其特征在于,所述步骤二中对由步骤一配准后的前中后三帧(分别用Ik|k-1,Ik,Ik|k+1表示)做三帧差分,计算过程如公式(2)、(3)、(4)所示:
D(x,y)=D1(x,y)∩D2(x,y) (4)
首先分别计算Ik|k-1与Ik的残差图,使用由实验确定的二值化阈值T将残差图二值化得到D1,对Ik与Ik|k+1采用相同的计算过程得到D2,对二值化图D1,D2做与运算(∩)得到三帧差分二值图D,其中(x,y)代表图像中的像素坐标,x=1,2...,M,y=1,2,...,N分别为像素的横纵坐标,M、N分别是图像的宽度和高度,为消除三帧差分二值图D中的孔洞与边缘裂缝,使用形态学膨胀算子对三帧差分二值图D进行处理并使用连通度检测算法获取二值图像中各个候选区域的轮廓区域集Ck={ci},i=1,…,T,T为第k帧中候选区域的数量,其中ci={zj},j=0,2,…,V,V为候选区域ci轮廓点的数量,zj=(xj,yj)为轮廓点的坐标,对每个轮廓区域进行最小凸包检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010695736.0/1.html,转载请声明来源钻瓜专利网。