[发明专利]一种适用于流媒体服务的音频视频封装方法无效
申请号: | 201210107112.8 | 申请日: | 2012-04-13 |
公开(公告)号: | CN102665103A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 冯军;卢国灿 | 申请(专利权)人: | 烽火通信科技股份有限公司 |
主分类号: | H04N21/236 | 分类号: | H04N21/236;H04N21/85 |
代理公司: | 北京捷诚信通专利事务所(普通合伙) 11221 | 代理人: | 魏殿绅;庞炳良 |
地址: | 430074 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 流媒体 服务 音频视频 封装 方法 | ||
技术领域
本发明涉及音频视频封装领域,具体来讲是一种适用于流媒体服务的音频视频封装方法。
背景技术
媒体文件通常由音频和视频两部分组成,将已经编码压缩好的音频和视频按照一定的格式放入一个文件中,就是音频视频的一种封装方法,这种格式叫封装格式。流媒体是指在互连网络中使用流式技术传输媒体文件,播放器在点播该媒体之前不用下载整个文件,而是一边收媒体流一边播放。
目前互联网上常见的媒体文件封装格式有TS(Transport Stream,传输流)、MP4(MPEG-4 Part 14)、FLV(Flash Video,Flash视频)等。然而,媒体文件播放的各个阶段,如:正常播放、快进快退播放、跳转播放,都需要音频视频编码元数据;这些数据在不同的封装格式中存放的位置不同。上述这些封装格式都会反复、零碎的从磁盘中读取音频视频元数据,因此增加了流媒体服务器对磁盘吞吐能力的开销,进而影响服务器的网络吞吐能力,无法满足高并发流媒体服务器的需求。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种适用于流媒体服务的音频视频封装方法,能够适应任何媒体文件格式的封装,将音频视频编码元数据集中存放,确保生成的元信息文件最小,提升磁盘性能,提高网络吞吐能力,从而满足高并发的流媒体服务需求。
为达到以上目的,本发明采取的技术方案是:一种适用于流媒体服务的音频视频封装方法,包括如下步骤:S1.为媒体文件建立单独的元信息文件,元信息文件包括头部和元信息文件体;S2.将媒体文件的头部去掉,将所述头部的媒体属性移至元信息文件的头部;S3.对媒体文件的音频帧和视频帧进行解析,将帧类型、图像组的起始时间戳和起始帧编号、音频帧和视频帧的起始边界记录在元信息文件体中;或仅对媒体文件的视频帧进行解析,将帧类型、图像组的起始时间戳和起始帧编号、视频帧的起始边界记录在元信息文件体中;S4.形成新媒体文件,对音频和视频未按解码时间戳排序的媒体文件,将音频帧和视频帧以帧为粒度,按解码时间戳递增的顺序,对音频帧和视频帧进行交错排列,形成重组后的新媒体文件;对音频和视频已经按照解码时间戳排序的媒体文件,直接设置为新媒体文件。
在上述技术方案的基础上,所述音频视频封装后包括元信息文件和新媒体文件。
在上述技术方案的基础上,所述媒体文件为MP4封装格式、传输流封装格式或Flash视频封装格式。
在上述技术方案的基础上,所述媒体文件为MP4封装格式时,从中读取音频编码格式、视频编码格式以及相关属性,并存入元信息文件的头部。
在上述技术方案的基础上,所述媒体文件为MP4封装格式时,从MP4文件的媒体数据盒子读取帧的类别、类型以及显示时间戳,将这些属性存入元信息文件体内。
在上述技术方案的基础上,从所述MP4文件的媒体数据盒子读取每个编码视频序列的起始字节偏移,以及该编码视频序列中第一个帧的解码时间戳,并将这些属性存入元信息文件体内。
在上述技术方案的基础上,从所述MP4文件的媒体数据盒子分别读取音频帧和视频帧,以及两者各自的解码时间戳,分别计算每个音频帧与第一个音频帧的解码时间戳差值,每个视频帧与第一个视频帧的解码时间戳差值,按照所得出的解码时间戳差值升序,将音频帧和视频帧交错排序,并存储在新媒体文件中。
在上述技术方案的基础上,所述媒体文件为传输流封装格式时,利用节目关联表和节目映射表,节读取音频编码格式、视频编码格式以及相关属性,并存入元信息文件的头部。
在上述技术方案的基础上,从所述传输流封装格式中读取帧的类别、类型以及解码时间戳,并根据解码时间戳计算每两个相邻视频帧的时间间隔,并将这些属性存入元信息文件体内。
在上述技术方案的基础上,所述媒体文件为Flash视频封装格式时,利用其元数据读取音频编码格式、视频的编码格式以及相关属性,并存入元信息文件头部。
在上述技术方案的基础上,从所述Flash视频封装格式中读取帧的类别、类型显示时间戳和解码时间戳,并根据解码时间戳每两个相邻视频帧的时间间隔,并将这些属性存入元信息文件体内。
在上述技术方案的基础上,所述相关属性至少包括视频的分辨率、宽高比、时间单元、框架级别ID参数、序列参数集和图像参数、高级音频编码的通道数、配置参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烽火通信科技股份有限公司,未经烽火通信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210107112.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据发送及接收方法、装置和系统
- 下一篇:非线性光学晶体硼酸氧镉钆