[发明专利]视频码率确定方法、装置、电子设备及其存储介质在审
申请号: | 202111315458.2 | 申请日: | 2021-11-08 |
公开(公告)号: | CN114040230A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 杨啖;周超 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | H04N21/2662 | 分类号: | H04N21/2662;H04N21/24;G06N3/04;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 曾世骁;苏银虹 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 确定 方法 装置 电子设备 及其 存储 介质 | ||
本公开提供了一种视频码率确定方法、装置、电子设备及其存储介质,所述视频码率确定方法包括:获取关于视频的视频分片的信息,其中,视频分片被转码为多个码率档位并且每个码率档位具有相应的质量分数,关于视频分片的信息包括该视频分片在每个码率档位下的质量分数;在下载视频分片的下载周期期间获取网络状态信息和播放器信息,并将获取的网络状态信息、播放器信息和关于视频分片的信息输入视频码率确定模型以获得针对待下载视频分片选择的码率档位;请求下载与选择的待下载视频分片的码率档位相应的视频分片。根据本公开的方法和装置能够基于视频质量感知信息来自适应切换视频码率,从而提供更为流畅的视频观看体验。
技术领域
本公开涉及互联网技术领域,尤其涉及一种确定要下载的视频的码率的方法、装置、电子设备及存储介质。
背景技术
近年来,随着移动互联网和4G、5G技术的进一步发展,流媒体业务日益流行。在多媒体产业界,都出现了一系列的成熟的点播(VOD,Video On Demand)平台公司。因此面对极速增长的点播业务,关于研究如何提升VOD用户的用户观看体验有着重要意义。
在VOD业务中,通常会利用多码率技术来保障用户享受高清晰、低卡顿的观看质量。多码率技术是指为用户提供不同分辨率档位(诸如超清、高清、标清、流畅等档位),用户可以根据自身网络环境优劣选择适配的清晰度。由于用户的选择清晰度需要一定的交互,因此VOD服务提供商都会选择开发自动算法来为用户自动适配所适合的清晰度,这种机制被称为多码率自适应算法(ABR,Adaptive Bitrate)。因此研究ABR算法,对用户的体验有着重要意义。
然而,相关技术的ABR方法在网络剧烈抖动后通常会导致用户观看卡顿,并且码率档位切换频繁,缺乏对视频质量的理解,并且无法解决带宽无法预测的问题。
发明内容
本公开提供一种确定视频码率和训练视频码率确定模型的方法、装置、电子设备及存储介质,以至少解决相关技术中的自适应切换视频码率存在的问题,也可不解决任何上述问题。
根据本公开的第一方面,提供了一种用于视频码率确定模型的训练方法,包括:获取关于训练样本视频所包括的视频分片的信息,其中,训练样本视频的视频分片被转码为多个码率档位并且每个码率档位具有相应的质量分数,关于视频分片的信息包括该视频分片在每个码率档位下的质量分数;在通过预先构建的播放环境下载视频分片的下载周期期间获取网络状态信息和播放器信息,并将获取的网络状态信息、播放器信息和关于视频分片的信息输入视频码率确定模型以获得针对待下载视频分片选择的码率档位;基于与针对每个视频分片选择的码率档位相应的质量分数、播放卡顿情况和码率档位切换次数构建奖励函数,并使用奖励函数来调整视频码率确定模型的参数。
根据本公开的第一方面,视频分片的质量分数由所述视频分片的视频编码客观指标和/或用户的主观感受评价确定,其中,视频编码客观指标包括以下指标中的至少一个:峰值信号噪声比PSNR、结构相似度指标SSIM或视频多方法评估融合VMAF。
根据本公开的第一方面,所述预先构建的播放环境包括客户端播放器、客户端缓冲器和内容分发服务器,其中,所述客户端播放器从内容分发服务器下载视频分片并将下载的视频分片存储到客户端缓冲器中,所述客户端播放器、客户端缓冲器和内容分发服务器之间具有用于传递视频分片的质量分数的接口。
根据本公开的第一方面,所述训练样本视频是从包括点播视频和短视频的视频数据集获取的。
根据本公开的第一方面,所述视频码率确定模型具有包括基于值的深度神经网络和基于策略的深度神经网络的深度强化学习结构,其中,基于策略的深度神经网络被配置为输出针对视频分片的码率档位选择,基于值的深度神经网络被配置为针对基于策略的深度神经网络的码率档位选择动作进行评分。
根据本公开的第一方面,基于策略的深度神经网络具有全连接的一维卷积层,并且采用Softmax函数作为激活函数,其中,所述基于策略的深度神经网络输出与所述多个码率档位相应的选择的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111315458.2/2.html,转载请声明来源钻瓜专利网。