[发明专利]一种面向检索的监控视频语义描述和检测建模方法有效
申请号: | 201210349622.6 | 申请日: | 2012-09-19 |
公开(公告)号: | CN102880692A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 张重阳;丁正彦;郑世宝 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/00 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 检索 监控 视频 语义 描述 检测 建模 方法 | ||
技术领域
本发明涉及监控视频的描述和检索领域,具体是一种针对监控视频的改进的语义描述和检索方法。
背景技术
21世纪是信息化时代,随着以多媒体为代表的信息技术产业的突飞猛进,人们对生活和工作环境的安全性要求也在不断提高,监控设施越来越多地出现在各种公共场所。目前,视频监控系统已经涉及到了社会生活的各行各业,例如交通路口、超市、银行、车站和居民小区等,与此同时,在各种大型活动场所和重要保卫区域的警卫工作中也配置了许多监控设备,如奥运会场地、人民广场、世博园区等。
1.传统视频监控系统存在的问题
视频监控系统是多媒体技术、网络通信技术、工业控制和智能计算技术等综合运用的产物,传统视频监控系统由于缺少智能,也被称为“被动监控”,其最大的特点就是以人为主。实时监控作用的发挥主要依靠监控室的值班人员实时观看监控画面,对画面出现的异常事件作出判断,实现报警联动指挥;而历史视频查看作用的发挥主要依靠工作人员人工调用并回放视频录像,同样需要人对感兴趣目标的判读,并确定其为证据。这种“被动监控”系统将会带来以下问题:
(1)随着监控探头和录像数据量的增加,其效率会大大下降,要从海量的监控录像数据中快速查找需要的证据是十分困难的;
(2)海量视频数据的传输和存储,将会造成资源浪费和信息污染。
随着城市监控范围和规模的迅速增长,完全依靠人工监看的传统视频监控系统已经不能满足需求,人们需要更智能化、自动化、自主化的视频监控系统,因此智能视频监控系统成为了当前提升视频监控系统效能的主要发展方向。
2.智能视频监控系统的产生
近年来,随着网络带宽、计算机处理能力、集成电路速度和存储容量的迅速提高,以及各种视频信息处理技术的出现,全程数字化、网络化的视频监控系统优势愈发明显,其高度的开放性、集成性和灵活性为视频监控系统和设备的整体性能提升创造了必要的条件,极大地推动了视频监控技术向智能化方向的发展。
智能视频监控技术主要指的是自动地分析和抽取视频源中的关键信息。智能视频技术借助计算机强大的数据处理功能,对视频画面中的海量数据进行高速分析,过滤掉用户不关心的信息,仅仅为监控者提供有用的关键信息,最终实现集视频采集、视频分析及描述为一体的智能监控系统。
3.基于内容的监控视频检索与描述
在智能视频监控系统中,如何利用计算机从海量的监控视频中快速地检索出用户需要的信息是当前监控领域急需解决的问题之一。
传统的基于文本的视频检索方法利用文本信息对视频进行注释,通过关键字抽取来描述视频信息。但由于目前的技术还不能对视频信息自动生成关键字描述,仍然需要使用手工的方法对视频进行解释和注释,这是一项非常耗时的工作,而且具有一定的主观性。因此,基于文本的视频检索方法已不能满足海量监控视频的检索需要。
目前,基于内容的视频检索方法(Content-Based Video Queries,CBVQ)已成为多媒体技术研究领域的热点,它突破了传统的基于文本检索技术的局限,直接对视频的内容进行分析,抽取特征和语义,利用这些内容特征建立索引并进行检索,提供了一种符合人类认知规律的高效检索方法。随着各种图像处理技术的进步,尤其是特征提取和目标分类算法的改进,基于内容的视频检索方法得到了广泛的应用,也能够很好地满足海量监控视频的检索需要。
从监控视频内容中提取的关键信息主要包括视频对象特征以及对象间的时空关系等,各种信息从不同层次对视频的内容进行了描述,为了能够有效地支持基于内容的监控视频检索,就需要通过视频建模将视频内容的描述信息有效地组织起来。通过对视频信息进行结构化的分层描述,在视频数据流之外产生一路视频数据的描述流,从而可以基于描述流进行高效检索和关联调阅,这将为海量视频的快速检索提供可行的解决方案。
4.监控视频的语义描述方案
语义是指数据的含义,对于计算机科学来说,语义一般是指用户对于那些用来描述现实世界的计算机符号的解释。用户对视频内容信息的检索和利用往往是建立在对视频语义的理解上,所以语义信息的描述在视频建模中占有十分重要的地位。根据一般人对视频含义的理解,可以根据用户查询角度的不同将视频的语义信息大致分为3个层次:
(1)第一个层次是视觉特征语义信息,用来描述视频的颜色、形状或运动等视觉特征及其组合,亦即底层语义;
(2)第二个层次是对象和对象间时空关系语义信息,通过识别和逻辑推理确定视频内容中的对象和类别及对象间的拓扑关系,亦即中层语义;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210349622.6/2.html,转载请声明来源钻瓜专利网。