[发明专利]一种基于输出的客观语音质量的评估方法有效
申请号: | 201710475912.8 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107293306B | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 李庆先;刘良江;王晋威;朱宪宇;熊婕;李彦博 | 申请(专利权)人: | 湖南省计量检测研究院 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/60 |
代理公司: | 长沙七源专利代理事务所(普通合伙) 43214 | 代理人: | 郑隽;周晓艳 |
地址: | 410014 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于输出的客观语音质量评估的方法,包括以下步骤:计算经过系统传输后的失真语音的梅尔频率倒谱系数;获得符合人耳听觉特性的参考模型;将失真语音的梅尔频率倒谱系数与符合人耳听觉特性的参考模型进行一致性量度计算;在原始语音中插入一段序列,计算在经过系统传输后的失真语音中提取出来该序列的误码率;根据一致性量度和误码率建立主观MOS分和一致性测度之间的映射关系,得到对待评价语音MOS分的客观预测模型,通过所述客观预测模型进行语音质量的客观评价。应用本发明的方法,步骤精简,使用方便,且能够有效地客观评估语音的质量,不依赖主观评价。 1 | ||
搜索关键词: | 失真语音 语音 一致性量度 参考模型 倒谱系数 梅尔频率 人耳听觉 系统传输 预测模型 误码率 语音质量评估 一致性测度 客观评估 客观评价 映射关系 原始语音 主观评价 输出 有效地 主观 评估 应用 | ||
计算经过系统传输后的失真语音的梅尔频率倒谱系数;获得符合人耳听觉特性的参考模型;
将失真语音的梅尔频率倒谱系数与符合人耳听觉特性的参考模型进行一致性量度计算;在原始语音中插入一段序列,计算在经过系统传输后的失真语音中提取出来该序列的误码率;
根据一致性量度和误码率建立主观MOS分和一致性测度之间的映射关系,得到对待评价语音MOS分的客观预测模型,通过所述客观预测模型进行语音质量的客观评价;
获得符合人耳听觉特性的参考模型详细过程如下:
设观测的特征向量序列为O=o1,o2,…,oT,该序列的状态模型序列为S=s1,s2,…,sN,则该序列的HMM模型表示为表达式7):
λ=(π,A,B) 7);
其中,π={πi=P(s1=i),i=1,2,…,N}为初始状态概率矢量;A={aij}为状态间跳转的转移概率矩阵,aij为从状态i跳转到状态j的概率;B={bi(ot)=P(ot|st=i),2≤i≤N‑1}为状态的输出概率分布集;
对连续HMM模型,观测序列为连续信号,其与状态j对应的信号空间用M个混合高斯密度函数的和来表示,如表达式8)和表达式9)下:
其中,cjk表示状态j的第k个高斯混合密度函数的系数;μjk是高斯密度函数的均值向量;Cjk为协方差矩阵,D为观测序列O的维数;HMM参数由观测序列O=o1,o2,…,oT估计得到,估计的目标是使模型与训练数据的似然函数P(O|λ)最大化来估计最新的λ,即使
所述似然函数p(O|λ)的前向概率计算公式如表达式10):
其中:α1(i)=πbi(o1),1≤i≤N;
所述似然函数p(O|λ)的后向概率计算公式如表达式11):
其中:βt (i)=1,1≤i≤N;
对给定观测序列O=o1,o2,…,oT通过重估计得到最新的λ,在此定义ξt(i,j)为t时刻状态为si且t+1时刻状态为sj的概率,由表达式12)得到:
在给定模型λ和观测序列O的条件下,状态si在时刻t的后验概率为表达式13):
由此,HMM参数λ重估计如下:
在t时刻状态j第k个高斯混合分量的参数cjk,μjk和Cjk由表达式14)、15)以及16)重新估计: