[发明专利]基于SVC的P2PVoD系统的视音频同步方法无效

专利信息
申请号: 201210271507.1 申请日: 2012-08-01
公开(公告)号: CN102761776A 公开(公告)日: 2012-10-31
发明(设计)人: 唐朝伟;袁杨;罗秀红 申请(专利权)人: 重庆大学
主分类号: H04N21/233 分类号: H04N21/233;H04N21/234;H04N21/236;H04N21/439;H04N21/4408
代理公司: 重庆市前沿专利事务所 50211 代理人: 郭云
地址: 400045 *** 国省代码: 重庆;85
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 svc p2pvod 系统 音频 同步 方法
【说明书】:

技术领域

发明涉及一种视音频同步方法,尤其涉及一种基于SVC的P2PVoD系统视音频同步方法。 

背景技术

随着宽带通信的广泛运用,互联网上的多媒体应用变得越来越流行。将SVC(Scalable Video Coding,可伸缩视频编码)应用于P2P(Peer-to-Peer,对等互联网技术)流媒体系统是解决P2P系统带宽容量显著变化和用户终端异构多样问题最有前途的方案。SVC允许“视频序列一次编码多种解码”,能够提供复合时空分辨率和高保真度的视频流,因此它能有效地满足P2P系统根据可用带宽进行码率调整的要求,同时可以很好地适应不同用户终端的时空分辨率,为用户提供更好的服务质量和用户体验。 

对于一个完整的基于SVC的P2P流媒体系统来说,SVC视频流与相应的音频流之间的同步非常关键,同步方法设计的好坏将直接影响系统的整体性能。视音频的同步与人的视听觉特性相关,图1将人的视听觉主观评价划分为5个等级:在声音超前20ms至声音落后90ms范围内,人们感觉不出视听质量的变化,该范围被称为不可觉察范围;一般将主观评价下降少于0.5级的范围称作可觉察范围,对应于声音超前45ms至落后125ms;将主观评价下降少于1.5级的范围认为是可接受范围,对应于声音超前90ms至落后185ms;在可接受范围内的视音频偏移被认为是同步的,但是当主观评价下降超过1.5级时,视音频偏移将被认为不同步。 

虽然P2P流媒体系统的视音频同步已经有比较成熟的解决办法,比较经典的有基于RTP/RTCP的视音频同步方法和MPEG-4封装时间戳同步方法等。但是目前P2P流媒体系统的视音频同步方法并不适合基于SVC的P2P流媒体系统的视音频同步需求。 

基于RTP/RTCP协议的视音频同步一般以音频为主媒体流,视频为从媒体流,在接收端基于同一时间轴,通过比较最近播放的音频帧和视频帧的播放时间标签判断同步关系,对视频帧采取重复或丢弃的方法实现视音频同步控制。该同步方法的优点是借助RTP/RTCP协议进行视音频的封装传输以及同步控制,技术应用成熟广泛。但是该方法的缺点是它只适合单层视频流,目前尚没有将SVC视频流封装成RTP数据包的方法,而且该方法需要对每个RTCP SR(Sender Reports)报文进行处理,对SVC这种多层视频流来说,算法复杂度较高。 

MPEG-4封装同步与基于RTP/RTCP协议的同步类似,也使用时间戳进行视音频同步控制。MPEG-4的定时模型为其I、B、P帧定义了解码时间戳(DTS)和合成时间戳(CTS),DTS用来表示解码时间,当DTS的时刻到来时,访问单元的解码将开始,CTS表示合成单元在该时刻开始表现。由于每个视频帧的表现时间相对于解码时间都推迟了一个周期T,所以相应音频帧的解码也要推迟一个周期。该方法的显著优点在于MP4可以根据网络带宽变化,通过选择性丢弃B帧或P帧的方式解决网络拥塞问题,同时对异构终端具有较好的适应性,特别是移动终端。但该方法同样存在只适合单层视频流的缺点,将SVC视频流封装进MP4的复杂度较高。 

由此可见,目前基于SVC的P2P流媒体系统的视频流与对应的音频流还是需要独立编码、独立传输、独立解码和播放,同时对各个阶段进行同步控制最后才能获得良好的播放效果。 

发明内容

本发明旨在解决现有技术中存在的技术问题,特别创新地提出了一种基于SVC的P2PVoD系统视音频同步方法,实现了基于SVC的视音频数据的传输同步。 

为了实现本发明的上述目的,本发明提供了一种基于SVC的P2PVoD系统的视音频同步方法,其特征在于包括以下步骤: 

S1、在服务器端将SVC视频流按照等时长分割成N个视频块,将该N个视频块分别划分为M层视频分片,其中各视频块中最底层的视频分片构成视频基础层,其上的每一层视频分片均构成一个视频增强层;将音频流按照等时长分割成N个音频层分片;将该音频层作为该视频基础层的下一层,从而生成视音频分层分片文件,其中SVC视频流分割成视频块的单位时长与音频流分割成音频层分片的单位时长相等,且N、M均为大于零的整数; 

S2、在服务器端,将该视音频分层分片文件的相关信息封装至Torrent文件中; 

S3、启动视音频分层分片下载线程,客户端从服务器端下载该Torrent文件,从该Torrent文件中提取该视音频分层分片文件的相关信息初始化视频解码器和音频解码器; 

S4、客户端下载该视音频分层分片文件; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210271507.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top