[发明专利]面向对象的视频控制流的编码及传输方法有效
申请号: | 201410075891.7 | 申请日: | 2014-03-04 |
公开(公告)号: | CN103826123B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 祝斐;舒俊;袁葆春 | 申请(专利权)人: | 无锡海之量软件科技有限公司 |
主分类号: | H04N19/20 | 分类号: | H04N19/20;H04N19/136;H04N19/85 |
代理公司: | 无锡市大为专利商标事务所(普通合伙)32104 | 代理人: | 曹祖良 |
地址: | 214194 江苏省无锡市锡山*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 对象 视频 控制 编码 传输 方法 | ||
技术领域
本发明涉及一种编码及传输方法,尤其是一种面向对象的视频控制流的编码及传输方法,属于视频处理的技术领域。
背景技术
随着近年来数字视频处理系统的推广应用,这个领域也投入了大量的探索研究工作。前沿研究出现在不同的数字视频应用领域,比如视频压缩,视频对象提取,以及视频分析等等。但是总的说来,这些研究归入两类:视频的内容和视频的属性。
视频压缩的标准和技术,一直在努力用最少的数据,来维持可接受的图像质量,比如MPEG2,MPEG4和H.264。另外,也有与此对应的压缩视频打包及传输的标准,如RTP/RTSP用于实时视频串流,而MP4/AVI/MOV/用于多媒体文件的包装。简而言之,这些研究开发主要集中视频内容的压缩,传输和存储。
另一方面,智能视频更多的关心视频对象的抽象,比如对象检测和识别,对象跟踪,对象匹配和搜索等。这个领域的研究,通过对视频属性的提取,极大的增加了观众与视频内容互动的可能性。换句话说,面向对象的视频处理开启了新兴智能互动视频应用的大门。
已经有很多基于视频对象的研究试验。但是,几乎都局限于对象本身及其使用。仅仅有限的研究触及了面向对象的控制流。这种控制流或在视频流中镶嵌,或单独串流。总之,基于对象的控制流是智能互动视频的基础,需要更多的探索和研究。
一般地,视频对象信息的传输是以帧为单位的。换句话说,对象描述与特定的帧绑定。如图1所示;用帧的标记数以及对象在本帧中的几何位置来索引对象。这样来打包对象及其控制信息会给视频内容本身的串流增加可观的超载。一幅压缩的H.2644CIF(720x480)P帧会小到只有几百字节,而对象属性和控制信息却要占10%的宝贵带宽。所以应该研究压缩传输对象属性和控制信息的方法。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种面向对象的视频控制流的编码及传输方法,其操作方便,能有效降低传输负载,适应范围广,安全可靠。
按照本发明提供的技术方案,所述面向对象的视频控制流的编码及传输方法,在视频压缩流的n个压缩帧后间插有具有对象控制的压缩帧,所述具有对象控制的压缩帧包括对象控制信息,所述对象控制信息包括n个压缩帧中对每一个视频对象均进行控制关联的对象控制单元,其中,所述对象控制单元中用多项式来描述视频对象的空间属性以及时间属性。
所述对象控制单元中还包括对象标识及标识头、对象操作描述及对象形状描述。
所述一个视频对象的空间属性、时间属性、对象识别码、对象操作描述以及对象形状描述均封装于同一个对象控制单元中。
所述对象控制单元中用多项式来描述视频对象的水平位移及垂直位移描述,以对视频对象的空间属性以及时间属性进行描述;对象控制单元中,对视频对象的水平位移及垂直位移描述包括等式识别码、多项式参数以及所述多项式参数与压缩帧对应的数目。
所述描述视频对象的空间属性以及时间属性的多项式包括一阶多项式、二阶多项式或三阶多项式。
所述对象控制信息内的多个对象控制单元组装成控制数据流。
所述控制数据流与压片压缩流内的压缩帧关联后独立传输。
本发明的优点:压缩帧与具有对象控制的压缩帧形成组合帧,具有对象控制的压缩帧包括对象控制信息,对象控制信息、包含对象控制单元,所述对象控制单元中用多项式来描述视频对象的空间属性以及时间属性,以用最少的数据量来描述视频对象的位移信息,使得视频控制流的额外负载降低到最小,适应范围广,安全可靠。
附图说明
图1为现有视频帧序列以及视频对象的表述示意图。
图2为现有视频控制流的封装示意图。
图3为现有视频对象在二维空间移动的示意图。
图4为视频对象在水平方向移动的示意图。
图5为视频对象在垂直方向移动的示意图。
图6为本发明的编码封装示意图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
如图1所示,是一个视频的帧序列及视频对象的示意图。其中101是这段视频的起始帧。在视频序列内每帧视频帧中都有几个不同形状的视频对象102。显然,每个单独的视频帧存在于二维空间,水平坐标用X轴104表示,垂直坐标用Y轴103表示。左上角是这个二维空间的坐标原点。除此之外,时间T轴106用来描述时间信息105,图1中视频序列的时间信息105起于时间点T0终于时间点Tn。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡海之量软件科技有限公司,未经无锡海之量软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410075891.7/2.html,转载请声明来源钻瓜专利网。