[发明专利]一种基于多任务深度学习的视频传输质量评价方法有效
申请号: | 201911218538.9 | 申请日: | 2019-12-03 |
公开(公告)号: | CN110913207B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 刘桂雄;蒋晨杰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | H04N17/00 | 分类号: | H04N17/00 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
地址: | 510640 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 深度 学习 视频 传输 质量 评价 方法 | ||
1.一种基于多任务深度学习的视频传输质量评价方法,其特征在于,所述方法包括:
A 构建多任务深度学习网络;所述多任务深度学习网络包括目标识别任务、图像分类任务与图像质量评价任务;
B 对所述网络进行训练:利用目标识别任务识别发送端和接收端视频帧中的频标并校验,根据频标检测出传输时延与卡顿指标;
利用目标识别任务定位接收端视频帧,并用图像分类任务检测传输画面失真类型,用图像质量评价任务检测传输画面质量分数;
C基于训练好的多任务深度学习网络得到待评价视频的视频传输时延与卡顿指标,并在有传输时延的情况下检测传输画面失真类型与传输画面质量分数;
所述步骤A中,目标识别任务、图像分类任务与图像质量评价任务为深度学习网络包含的3个任务,其中图像分类任务与图像质量评价任务使用孪生神经网络;所述3个任务的骨干网络均为ResNet,图像分类任务与图像质量评价任务的共享层采用硬参数共享,目标识别任务与图像分类任务和图像质量评价任务的共享层采用软参数共享,所述骨干网络为3个任务的共享层;
所述步骤B中,频标包含序列号和校验号,序列号用来定位视频帧,校验号用来校验识别是否出错,通过目标识别任务识别出发送端与接收端视频帧中的频标的序列号,根据两者差值除以视频帧率,即可算出传输时延;通过检测接收端视频帧中同一序列号的维持时间并与阈值对比,即可判断有无卡顿及卡顿时长。
2.如权利要求1所述的基于多任务深度学习的视频传输质量评价方法,其特征在于,所述目标识别任务的骨干网络包括浅层特征提取网络结构和深层特征提取网络结构,其中,所述浅层特征提取网络结构提取浅层特征,输出特征图为F0,通道数为256;后续的所述深层特征提取网络结构由5个单元组成,每个单元先后包含两个卷积层:其中一个卷积层有128个步长为1的1×1×256卷积核、另一个卷积层有256个步长为2的3×3×128卷积核;每个单元输出特征图为F
3.如权利要求1所述的基于多任务深度学习的视频传输质量评价方法,其特征在于,所述图像质量评价任务,基于接收端视频帧与其对应的参考图像进行全参考图像质量评价,所述图像分类任务与图像质量评价任务的共享层采用孪生神经网络,所述孪生神经网络输入分别为参考图像和接收端视频帧,记所述图像分类任务与图像质量评价任务的骨干网络输出特征图分别为Fref和Fdis,将特征图Fref和Fdis融合为Ffus。
4.如权利要求3所述的基于多任务深度学习的视频传输质量评价方法,其特征在于,所述图像分类任务通过孪生神经网络提取到融合特征Ffus,通道数为512,在所述孪生神经网络之后还包含两个卷积层和两个全连接层:所述两个卷积层即 256个步长为1的1×1×512卷积核和512个步长为2的3×3×256卷积核,所述两个全连接层即尺寸分别为1024与
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911218538.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:货车集货控制方法、系统及计算机可读存储介质
- 下一篇:一种用于风管吊装的工装