[发明专利]一种描述和捕获视频对象的方法及设备有效

申请号：	200710165614.5	申请日：	2007-10-23
公开（公告）号：	CN101420595A	公开（公告）日：	2009-04-29
发明（设计）人：	赵光耀	申请（专利权）人：	华为技术有限公司
主分类号：	H04N7/18	分类号：	H04N7/18;G06T7/00
代理公司：	北京德琦知识产权代理有限公司	代理人：	宋志强;麻海明
地址：	518129广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种描述捕获视频对象方法设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及视频技术，特别涉及一种描述和捕获视频对象的方法及设备。

背景技术

视频监控(Video Surveillance)技术经过多年的数字化发展，已逐步形成网络化，为生产监控，如生产线流程监控、安全监控，如火车站、地铁站、飞机场的安全监控，以及其它监控如病人护理发挥了积极的作用，然而，随着监控对象的增多以及各对象属性资料信息的更新和增加，如何对大量的视频监控资料进行方便地管理、检索、视频人机交互、智能再处理，充分发挥网络化视频监控系统的优势，是目前视频交互系统(Interactive Video System)需要解决的问题。

运动图像专家组(MPEG，Moving Picture Experts Group)，即国际标准化组织和国际电工委员会第一联合技术组第29分委会第11工作组(ISO/IEC JTC1/SC29/WG11)，负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作，从1996年10月开始研究多媒体内容描述接口(Multimedia Content Description Interface)，也就是MPEG-7，于 2002年形成了国际标准ISO/IEC 15938，First edition，定义了100多个描述工具，用于描述各种多媒体信息，这些“描述”(包括描述子和描述模式)与其内容关联，允许快速有效地搜索用户感兴趣的资料，带有MPEG-7数据的资料可以包含静止图像、图形、3D模型、音频、语音、视频，以及这些元素如何在多媒体表现中组合的信息，而且，这些通用数据类型的特例还可以包含面部表情和个人化的特性。

MPEG-7支持多种音频和视觉的描述，并根据描述信息的抽象层次，提供一种描述多媒体的方法以便表示不同层次上的用户对信息的需求。以视觉内容为例，较低抽象层包括颜色、视觉对象、纹理、草图、形状、尺寸、体积、空间、运动(轨道)和位置关系等；高层将给出语义信息：如“这是一个场景：一个鸭子正躲藏在树后并有一个汽车正在幕后通过”。抽象层特征一般以完全自动的方式提取，而高层特征一般需要通过与用户的交互来实现。

MPEG-7特别适用于多媒体检索，包括对视频监控材料的检索，通过搜索引擎来匹配查询数据和MPEG-7的音视频描述，如对于图形的查询：通过在屏幕上画几条线就能得到类似图形、标识、表意文字(符号)等的一组图像；又如，对于运动的查询：对一组给定的物体，描述在物体之间的运动关系，就可以得到实现所描述的时空关系的动画列表。

目前的随机存取视频系统，比如光盘、硬盘等，具有“播放、停止、快进、快退、暂停、拖动”操作模式，可以根据视频节目单来选择需要观看的视频片段，也可以从指定的时间点来播放，并通过符合MPEG-7的对象描述可以播放检索结果对应的视频片段。

图1为现有描述方法中使用的动态视频对象描述符示意图，参见图1，为每帧出现的每个对象建立视频对象描述符(Object Descriptor)，描述对象的各种属性，在视频对象描述符里说明其形状、尺寸、分层、持续时间、活动、活动参数以及其他对象特征。

在图1中，对于一个视频序列，每个序列号为一帧，为每帧出现的每个对象建立一个视频对象描述符，在视频对象描述符里说明对象的轮廓坐标、对象编号、尺寸、分层、持续时间、活动、活动参数以及其他对象特征。逐帧的视频对象描述符形成一个视频对象描述文件。举例来说，如果同一个活动对象在N帧图像中出现，就建立N个视频对象描述符来表示它的跟踪关系；如果M个活动对象在N帧图象中出现，就建立M×N个视频对象描述符来表示它的跟踪关系；在每个视频对象描述符里，记录该对象的轮廓上所有像素点的轮廓坐标、视频对象身份编号、尺寸、分层、持续时间、活动、活动参数、身份照片、身份参数以及其他对象特征。在进行重放视频序列时，系统从视频对象描述符里恢复每个对象的轮廓坐标与视频序列的对应关系，从而实现满足视频监控所需要的人机交互功能。

从图1中可以看出，由于对每帧出现的每个对象建立一个视频对象描述符，每个视频对象描述符都需要描述对象的特征，因此，当视频序列较长，和/或视频对象较多时，用于描述视频对象的视频对象描述符的数量和尺寸是非常庞大的，对视频资料的快速检索造成了困难。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710165614.5/2.html，转载请声明来源钻瓜专利网。

上一篇：砖混建筑墙体的分割拆除与再利用方法
下一篇：一种多媒体数据的存储方法及精确定位回放位置的方法

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N7-00 电视系统
H04N7-01 .制式的转换
H04N7-015 .高清晰度电视系统
H04N7-025 .用于非图像数据传输系统，例如在电视帧的有效部分的图文传输
H04N7-04 .传送单一电视信号的系统，即由单一载波传送图像和伴音
H04N7-06 .同时传送单一电视信号的系统，即用一个以上载波传送图像和伴音

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种描述和捕获视频对象的方法及设备有效

专利文献下载