[发明专利]一种立体视频文件的描述与管理方法有效
申请号: | 201310029683.9 | 申请日: | 2013-01-25 |
公开(公告)号: | CN103179421A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 李景颉;王高飞;李广群;赖守波 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | H04N13/00 | 分类号: | H04N13/00;H04N21/236;H04N21/234;H04N7/26 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 立体 视频文件 描述 管理 方法 | ||
1.一种立体视频文件的描述与管理方法,其特征在于:它包括以下步骤:
(1)建立一种用于描述立体视频各个视角的独立物理文件、音频文件、透明度文件、深度信息文件以及来自3D节目源的3D元数据文件或数据之间的逻辑关系的文件格式,该文件格式存储3D素材杂散文件簇内的各通道物理文件的路径、属性、偏移位置信息以及3D元数据信息,描述各通道物理文件的路径并具备开放的文件结构,可随时扩充新的通道数据,外部应用系统可通过访问该文件格式快速获取3D素材的属性信息;
(2)提供该文件格式的实现方法;
(3)提供该文件格式的编码与解码方法。
2.根据权利要求1所述的一种立体视频文件的描述与管理方法,其特征在于:所述的立体视频文件包括双目立体视频文件和多视角立体视频文件。
3.根据权利要求1或2所述的一种立体视频文件的描述与管理方法,其特征在于:所述的文件格式包括但不限于:
a)视频通道元数据信息包,包括双目立体视频和多视角立体视频通道的视频源文件的格式信息、文件名信息、源文件的有效起止位置、源文件与其他源文件的对齐关系;
b)视频通道元数据信息包,在a)的基础上,如果视频通道为图片或图片序列的,包括对图片或图片序列的格式信息、文件名信息、图片序列持续长度、与其他源文件的对齐关系;
c)音频通道元数据信息包,包括双目立体视频和多视角立体视频的音频源文件格式信息、文件名信息、源文件的有效起止位置、源文件与其他源文件的对齐关系,如果音频通道与a)中的视频通道复用同一物理文件,则包括描述音频通道与视频通道之间复用关系的信息;
d)透明度信息通道元数据信息包,包括双目立体视频和多视角立体视频的键通道源文件格式信息、路径信息、源文件的有效起止位置、源文件与其他源文件的对齐关系;
e)深度信息通道元数据信息包,包括双目立体视频和多视角立体视频的深度信息通道源文件格式信息、路径信息、源文件的有效起止位置、源文件与其他源文件的对齐关系;
f)3D元数据信息包,包括描述双目立体视频和多视角立体视频各视角之间的关系的3D元数据信息和来自3D节目源的元数据信息;
g)附加信息包,包括创建文件的厂商、产品名及日期信息。
4.根据权利要求1所述的一种立体视频文件的描述与管理方法,其特征在于:所述的该文件格式的实现方法包括使用xml文件实现。
5.根据权利要求1所述的一种立体视频文件的描述与管理方法,其特征在于:所述的该文件格式的编码方法包括以下步骤:
S101:上层调用者下发编码任务给编码模块;
S102:编码模块获取编码任务并启动编码总控线程,在内存中创建该文件格式的内存数据结构体,填充目前已知的各项信息;
S103:编码总控线程分别创建各通道编码处理线程,包括每个视角的视频文件编码线程、每个音频文件编码线程、每个Key文件编码线程、每个深度文件编码线程;
S104:编码模块总控线程从上层3D渲染器获取到各视角各通道的数据,分发给各文件编码线程,各文件编码线程根据目标文件格式进行数据处理,并将处理结果送编码器进行编码,编码结果送文件封装器写文件,同时,统计编码进度;
S105:所有帧编码完毕后,各编码线程关闭文件,将编码进度信息反馈给编码总控线程,编码总控线程将文件帧数信息刷新到该文件格式的内存数据结构体,创建该文件格式的物理文件,并将内存数据写入物理文件;
S106:编码总控线程结束,整个编码流程结束。
6.根据权利要求5所述的一种立体视频文件的描述与管理方法,其特征在于:所述的编码任务包括:目标3D素材的3D格式信息、3D元数据、各视角图像格式信息、各视角物理文件名和格式信息、音频文件名和格式信息、Key通道文件名和格式信息、深度通道文件名和格式信息、各视角、各通道的文件有效区间信息。
7.根据权利要求1或5所述的一种立体视频文件的描述与管理方法,其特征在于:所述的该文件格式的解码方法包括以下步骤:
S201:解码模块打开并读取该文件格式内的3D素材信息;
S202:根据该文件格式内索引的物理文件个数,创建视音频解码线程,每个线程负责一个文件的解码;
S203:解码线程打开并读取对应的物理文件,调用解码器对其进行解码;
S204:解码模块按照上层调用者对解码结果格式的需求对各通道的解码结果数据进行整合,并送至上层指定的数据缓冲区;
S205:重复步骤S203~S204;
S206:文件解码完毕,关闭各路物理文件,结束解码流程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310029683.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生产碳锌复合材料的专用装置
- 下一篇:一种高纯度氩气净化装置