[发明专利]一种基于样本窗的双核密度估计实时背景建模方法及装置有效
申请号: | 201910055496.5 | 申请日: | 2019-01-21 |
公开(公告)号: | CN109903266B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 程国醒;范玉魁;苗立晓;孙毅 | 申请(专利权)人: | 深圳市华成工业控制股份有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/174;G06T7/194;G06T7/254 |
代理公司: | 长沙睿翔专利代理事务所(普通合伙) 43237 | 代理人: | 周松华 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 密度 估计 实时 背景 建模 方法 装置 | ||
本发明公开了一种基于样本窗的双核密度估计实时背景建模方法及装置。方法包括以下步骤:S1、加工机械及工件定位系统开始工作后,从第N+1帧起,开始实际的工件操作、背景建模和工件定位;S2、取前N帧图像上对应像素点的亮度值x1,x2,...,xN作为计算该像素点的概率密度估计的样本,采用长期核计算概率密度模型;S3、从第N+2帧开始,根据所计算的长期核概率密度Pl(xt),选择高于设定阈值Tbf的像素计算短期核计算概率密度模型;将短期核计算概率密度模型合并到长期核计算概率密度模型上,以得到最终的概率密度模型。本发明能够消除震动引起的图像平移影响。
技术领域
本发明涉及视觉伺服控制技术领域,更具体地说,特别涉及一种基于样本窗的双核密度估计实时背景建模方法及装置。
背景技术
视觉伺服控制是机器人应用,特别是各种加工行业中机械手控制的重要研究方向,主要任务是利用视觉信息控制机械手末端执行器与目标物体之间的相对位姿,实现快速准确地自动操作加工。为实现上述目标,首先必须从摄像头监视视频(图像序列)中检测出待操作的目标物体,即工件定位。
常见的目标检测方法主要有帧间差分法和背景差分法[别礼.一种基于核密度的快速背景差分法[J].工程技术,2015,(5):296.]。帧间差分法的特点是通过计算相邻图像帧之间的像素变化情况,来对前景目标进行检测。其优点是算法简单,检测速度快;缺点是对摄像机要求高,且检测精度低。背景差分法的特点是根据当前帧和背景帧的区别来检测目标,对场景适应性好。其优点是检测速度快,精度高;缺点是背景状况一般较为复杂,需要配有相应的背景建模及更新算法,否则会导致检测失效。实际应用中,背景差分法以其检测精度高、环境适应性强、对动静态目标都有效等特点,在各类视频监控系统中得到广泛使用。
背景差分法的研究重点就是背景的建模与更新算法。目前主要有三类背景建模方法:基于特征重构的方法、基于统计模型的方法和基于背景提取的方法[朱振峰,赤诚,赵耀.基于多尺度的增强ViBe背景建模[J].北京交通大学学报,2015,39(2):1-6.]。基于特征重构的方法主要利用在线学习获得一定数量的基向量,通过这些基向量对当前帧进行重构,重构误差即可视作前景目标。该方法的不足在于在线学习需要足够多的样本(图像帧)用于学习基向量,导致其适应性较差。基于统计模型的方法主要包括参数估计模型(如单高斯、混合高斯(Gaussian mixed model,GMM)与增强混合高斯)和非参数估计模型(如核密度估计 (kernel density estimation,KDE))。该类方法主要是根据每个像素在时间域上的分布信息构造其背景模型,因此需要一定长度的视频图像序列进行学习。GMM将背景像素在时间域上的分布假设为混合高斯模型,通过对多个高斯模型的选择及模型参数的更新加强模型的鲁棒性。不同于GMM,KDE利用基于核函数的非参数密度估计方法对背景进行建模,更好的适应复杂背景的变化,在处理阴影、风吹树叶的抖动现象等场景方面取得了较好的效果[Elgammal A,Duraiswami R,Harwood D,et a1.Background and foreground modelingusing nonparametric kernel density estimation for visual surveillance[J].Proceedings of the IEEE,2002,90(7):1151—1163.]。其缺点是,基于统计模型的方法在模型初始化阶段需要足够多的图像帧作为样本,且计算量大、模型更新速度较慢,导致检测效率不高。近年来若干研究针对其精度和计算效率进行了改进[乔俊锋,朱虹,史静等.一种快速核密度估计背景建模方法[J].计算机工程与应用,2012,48(5):192-193(203).],但尚未有针对工厂环境的改进措施。为更好满足实时性要求,Bamich等人提出了视觉背景提取(Visual Background extractor,ViBe)算法。不同于统计背景建模方法,视觉背景提取在本质上是一种联合时-空模型,通过随机选取邻域内若干背景像素值作为背景模型,并结合无记忆性模型更新的方式,取得了很好的实时性能。但其对于光照变化、阴影和多模态背景等复杂背景变化的鲁棒性不足。而以背景分割为代表的一些改进措施提高了ViBe模型的鲁棒性,但也导致算法复杂度不同程度的提高,大大降低了算法的实时性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华成工业控制股份有限公司,未经深圳市华成工业控制股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910055496.5/2.html,转载请声明来源钻瓜专利网。