[发明专利]一种基于感知哈希算法加快视频帧实时目标检测的方法有效
申请号: | 201911124925.6 | 申请日: | 2019-11-18 |
公开(公告)号: | CN111062975B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 陈旋;王冲;崇传兵 | 申请(专利权)人: | 江苏艾佳家居用品有限公司 |
主分类号: | G06T7/262 | 分类号: | G06T7/262;G06T7/223 |
代理公司: | 南京新慧恒诚知识产权代理有限公司 32424 | 代理人: | 邓唯 |
地址: | 211100 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 感知 算法 加快 视频 实时 目标 检测 方法 | ||
本发明涉及一种基于感知哈希算法加快视频帧实时目标检测的方法,属于视频处理技术领域。本发明建立在相邻帧的间隔时间短暂,图片变化微妙的特性,利用上一帧的目标检测结果,基于图片指纹信息,沿用上一帧的检测结果,或者减小当前帧的检测区域,从而加快目标检测的速度。
技术领域
本发明涉及一种基于感知哈希算法加快视频帧实时目标检测的方法,属于视频处理技术领域。
背景技术
目标检测是一种为了检测汽车、建筑物和人类等目标对象的计算机视觉技术,这些对象通常可以通过图片或视频来识别。目标检测会定位图像中的对象,并在该对象周围绘制一个包围框。这过程通常分为两步:目标分类并确定类型,然后在该对象周围绘制一个框。
视频目标检测要解决的问题是对于视频中每一帧目标的正确识别和定位。相对于图像目标检测,视频是高度冗余的,包含了大量时间局部性(temporal locality,即在不同的时间是相似的)和空间局部性(spatial locality,即在不同场景中看起来是相似的),既Temporal Context(时间上下文)的信息。充分利用好时序上下文关系,可以解决视频中连续帧之间的大量冗余的情况,提高检测速度;还可以提高检测质量,解决视频相对于图像存在的运动模糊、视频失焦、部分遮挡以及形变等问题。
现有的目标检测大都基于深度学习来完成,计算量巨大,需要很强大的GPU才能进行,而GPU资源相对而言还是很昂贵的,硬件成本太高;视频目标检测视场景不同,大都情况下都是静态背景图,很少的时间会出现运动目标,这样只是针对背景图进行不断的检测,实际并没有目标,纯粹是在浪费GPU资源。
发明内容
本发明所要解决的技术问题在于:基于视频本身存的特性的来缩小计算量,提供一种加快视频帧实时目标检测的方法,缩小计算量,节省GPU的资源,加快目标检测的速度,可以释放有限昂贵的系统资源,可以缩短目标检测的时间。
一种基于感知哈希算法加快视频帧实时目标检测的方法,包括如下步骤:
第1步,获得视频第一帧f1,计算f1的图片指纹p1,并进行目标检测,获得目标box1;
第2步,获得视频第一帧f2,计算f2的图片指纹p2;比较p1和p2;
如果p1=p2,则认为f2中的目标也是box1;
如果p1≠p2,把box1放大一定比例,作为box2;
第3步,将f1和f2中都删除掉与box2相同大小和位置的区域,再对删除后的区域再次计算图片指纹,得到p3和p4;
第4步,如果p3=p4,则在第二帧中与box2相同大小和位置的区域进行目标检测,得到目标box3;如果p3≠p4,则对f2未删除前的数据进行目标检测,获得目标box4。
在一个实施方式中,放大一定比例是没有特别限制,可以是放大10%、30%、50%、100%、150%等,根据目标情况可以人为设定。
在一个实施方式中,图片指纹通过哈希方法计算得到,具体的步骤包括:
S1,缩小图片尺寸;
S2,简化色彩;
S3,离散余弦变换处理;
S4,取离散余弦变换处理后的矩阵的左上角部分;
S5,计算S4中得到的矩阵中所有值的平均值;再对S4中得到的矩阵设置0或1的64位的hash值,大于等于平均值的设为“1”,小于平均值的设为“0”,得到图片指纹。
在一个实施方式中,S1是指缩小至8x8的尺寸。
在一个实施方式中,S2中简化色彩是指转化为64级灰度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏艾佳家居用品有限公司,未经江苏艾佳家居用品有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911124925.6/2.html,转载请声明来源钻瓜专利网。