[发明专利]一种描述和捕获视频对象的方法及设备有效
申请号: | 200710165614.5 | 申请日: | 2007-10-23 |
公开(公告)号: | CN101420595A | 公开(公告)日: | 2009-04-29 |
发明(设计)人: | 赵光耀 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N7/18 | 分类号: | H04N7/18;G06T7/00 |
代理公司: | 北京德琦知识产权代理有限公司 | 代理人: | 宋志强;麻海明 |
地址: | 518129广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 描述 捕获 视频 对象 方法 设备 | ||
技术领域
本发明涉及视频技术,特别涉及一种描述和捕获视频对象的方法及设 备。
背景技术
视频监控(Video Surveillance)技术经过多年的数字化发展,已逐步形成 网络化,为生产监控,如生产线流程监控、安全监控,如火车站、地铁站、 飞机场的安全监控,以及其它监控如病人护理发挥了积极的作用,然而,随 着监控对象的增多以及各对象属性资料信息的更新和增加,如何对大量的视 频监控资料进行方便地管理、检索、视频人机交互、智能再处理,充分发挥 网络化视频监控系统的优势,是目前视频交互系统(Interactive Video System)需要解决的问题。
运动图像专家组(MPEG,Moving Picture Experts Group),即国际标准 化组织和国际电工委员会第一联合技术组第29分委会第11工作组(ISO/IEC JTC1/SC29/WG11),负责数字视频、音频和其他媒体的压缩、解压缩、处 理和表示等国际技术标准的制定工作,从1996年10月开始研究多媒体内容 描述接口(Multimedia Content Description Interface),也就是MPEG-7,于 2002年形成了国际标准ISO/IEC 15938,First edition,定义了100多个描述 工具,用于描述各种多媒体信息,这些“描述”(包括描述子和描述模式)与 其内容关联,允许快速有效地搜索用户感兴趣的资料,带有MPEG-7数据的 资料可以包含静止图像、图形、3D模型、音频、语音、视频,以及这些元 素如何在多媒体表现中组合的信息,而且,这些通用数据类型的特例还可以 包含面部表情和个人化的特性。
MPEG-7支持多种音频和视觉的描述,并根据描述信息的抽象层次,提 供一种描述多媒体的方法以便表示不同层次上的用户对信息的需求。以视觉 内容为例,较低抽象层包括颜色、视觉对象、纹理、草图、形状、尺寸、体 积、空间、运动(轨道)和位置关系等;高层将给出语义信息:如“这是一 个场景:一个鸭子正躲藏在树后并有一个汽车正在幕后通过”。抽象层特征 一般以完全自动的方式提取,而高层特征一般需要通过与用户的交互来实 现。
MPEG-7特别适用于多媒体检索,包括对视频监控材料的检索,通过搜 索引擎来匹配查询数据和MPEG-7的音视频描述,如对于图形的查询:通过 在屏幕上画几条线就能得到类似图形、标识、表意文字(符号)等的一组图 像;又如,对于运动的查询:对一组给定的物体,描述在物体之间的运动关 系,就可以得到实现所描述的时空关系的动画列表。
目前的随机存取视频系统,比如光盘、硬盘等,具有“播放、停止、快 进、快退、暂停、拖动”操作模式,可以根据视频节目单来选择需要观看的 视频片段,也可以从指定的时间点来播放,并通过符合MPEG-7的对象描述 可以播放检索结果对应的视频片段。
图1为现有描述方法中使用的动态视频对象描述符示意图,参见图1, 为每帧出现的每个对象建立视频对象描述符(Object Descriptor),描述对象 的各种属性,在视频对象描述符里说明其形状、尺寸、分层、持续时间、活 动、活动参数以及其他对象特征。
在图1中,对于一个视频序列,每个序列号为一帧,为每帧出现的每个 对象建立一个视频对象描述符,在视频对象描述符里说明对象的轮廓坐标、 对象编号、尺寸、分层、持续时间、活动、活动参数以及其他对象特征。逐 帧的视频对象描述符形成一个视频对象描述文件。举例来说,如果同一个活 动对象在N帧图像中出现,就建立N个视频对象描述符来表示它的跟踪关 系;如果M个活动对象在N帧图象中出现,就建立M×N个视频对象描述 符来表示它的跟踪关系;在每个视频对象描述符里,记录该对象的轮廓上所 有像素点的轮廓坐标、视频对象身份编号、尺寸、分层、持续时间、活动、 活动参数、身份照片、身份参数以及其他对象特征。在进行重放视频序列时, 系统从视频对象描述符里恢复每个对象的轮廓坐标与视频序列的对应关系, 从而实现满足视频监控所需要的人机交互功能。
从图1中可以看出,由于对每帧出现的每个对象建立一个视频对象描述 符,每个视频对象描述符都需要描述对象的特征,因此,当视频序列较长, 和/或视频对象较多时,用于描述视频对象的视频对象描述符的数量和尺寸 是非常庞大的,对视频资料的快速检索造成了困难。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710165614.5/2.html,转载请声明来源钻瓜专利网。