[发明专利]一种视频及音频联合质量评价方法和装置有效
申请号: | 202010171567.0 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111479105B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 翟广涛;闵雄阔;杨小康 | 申请(专利权)人: | 上海交通大学 |
主分类号: | H04N17/00 | 分类号: | H04N17/00;H04N21/234;H04N21/233;H04N21/44;H04N21/439;H04N21/475 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 刘翠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 音频 联合 质量 评价 方法 装置 | ||
1.一种视频及音频联合质量评价方法,其特征在于,包括:
S1:利用视频质量评价模型预测输入视频信号的视频质量,得到视频预测质量分数Qv及视频预测质量特征fv;利用音频质量评价模型预测输入音频信号的音频质量,得到音频预测质量分数Qa及音频预测质量特征fa;
S2:对S1中得到的视频预测质量分数Qv及音频预测质量分数Qa分别进行归一化处理,得到归一化的视频预测质量分数及音频预测质量分数
S3:融合S2中得到的归一化的视频预测质量分数及音频预测质量分数或,融合S1中得到的视频预测质量特征fv及音频预测质量特征fa,进而得到预测的视频及音频联合质量分数Qav或特征fav;
所述S2中,对音频预测质量分数Qa进行归一化处理的方法,包括:
对音频预测质量分数Qa进行单调上升归一化处理的方法为:
或
对音频预测质量分数Qa进行单调下降归一化处理的方法为:
其中,和分别是Qa的已知值的边界;
归一化后的音频预测质量分数在[0,1]范围内具有单调趋势,并与归一化后的视频预测质量分数具有相同的单调趋势;
所述S2中,对视频预测质量分数Qv进行归一化处理的方法,包括:
对视频预测质量分数Qv进行单调上升归一化处理的方法为:
或
对视频预测质量分数Qv进行单调下降归一化处理的方法为:
其中,和分别是Qv的已知值的边界;
归一化后的音频预测质量分数在[0,1]范围内具有单调趋势,并与归一化后的音频预测质量分数具有相同的单调趋势;
所述S3中,对归一化的视频预测质量分数及音频预测质量分数进行融合,采用如下任意一种或任意多种方法:
-乘积方式的融合方法:
其中,Qav为预测的视频及音频联合质量分数;
-加权乘积方式的融合方法:
其中,0≤w≤1,用于控制两种模态之间的相对权重;
-采用经过数据训练的回归器进行融合:
其中,回归器SVR利用单一模态的质量预测分数及以及给定的主观音视频质量真值来进行训练;
所述S3中,对视频预测质量特征fv及音频预测质量特征fa进行融合的方法为:
采用回归器进行融合:
fav=SVR(fv,fa)
其中,fav为预测的视频及音频联合质量特征。
2.根据权利要求1所述的一种视频及音频联合质量评价方法,其特征在于,所述S1中,采用如下任意一种或任意多种视频质量评价方法作为视频质量评价模型,并对输入视频信号进行视频质量预测:
-视频多方法评价融合算法VMAF;
-时空半参考熵差指标STRRED;
-空域高效熵差指标SPEED;
-视频质量模型VQM;
-结构相似性指标SSIM;
-多尺度结构相似性指标MS-SSIM;
-像素域视觉信息保真度算法VIFP;
-特征相似性算法FSIM;
-梯度幅值相似性偏差算法GMSD。
3.根据权利要求1所述的一种视频及音频联合质量评价方法,其特征在于,所述S1中,采用如下任意一种或任意多种音频质量评价方法作为音频质量评价模型,并对输入音频信号进行音频质量预测:
-音频质量感知评价模型PEAQ;
-短时客观清晰度指标STOI;
-模拟语音质量客观监听算法ViSQOL;
-对数似然值比例LLR;
-信噪比SNR;
-分段信噪比segSNR。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010171567.0/1.html,转载请声明来源钻瓜专利网。