[发明专利]一种基于输出的客观语音质量的评估方法有效

申请号：	201710475912.8	申请日：	2017-06-21
公开（公告）号：	CN107293306B	公开（公告）日：	2018-06-15
发明（设计）人：	李庆先;刘良江;王晋威;朱宪宇;熊婕;李彦博	申请（专利权）人：	湖南省计量检测研究院
主分类号：	G10L25/24	分类号：	G10L25/24;G10L25/60
代理公司：	长沙七源专利代理事务所(普通合伙) 43214	代理人：	郑隽;周晓艳
地址：	410014 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于输出的客观语音质量评估的方法，包括以下步骤：计算经过系统传输后的失真语音的梅尔频率倒谱系数；获得符合人耳听觉特性的参考模型；将失真语音的梅尔频率倒谱系数与符合人耳听觉特性的参考模型进行一致性量度计算；在原始语音中插入一段序列，计算在经过系统传输后的失真语音中提取出来该序列的误码率；根据一致性量度和误码率建立主观MOS分和一致性测度之间的映射关系，得到对待评价语音MOS分的客观预测模型，通过所述客观预测模型进行语音质量的客观评价。应用本发明的方法，步骤精简，使用方便，且能够有效地客观评估语音的质量，不依赖主观评价。 1
搜索关键词：	失真语音语音一致性量度参考模型倒谱系数梅尔频率人耳听觉系统传输预测模型误码率语音质量评估一致性测度客观评估客观评价映射关系原始语音主观评价输出有效地主观评估应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于输出的客观语音质量的评估方法，其特征在于，包括以下步骤：

计算经过系统传输后的失真语音的梅尔频率倒谱系数；获得符合人耳听觉特性的参考模型；

将失真语音的梅尔频率倒谱系数与符合人耳听觉特性的参考模型进行一致性量度计算；在原始语音中插入一段序列，计算在经过系统传输后的失真语音中提取出来该序列的误码率；

根据一致性量度和误码率建立主观MOS分和一致性测度之间的映射关系，得到对待评价语音MOS分的客观预测模型，通过所述客观预测模型进行语音质量的客观评价；

获得符合人耳听觉特性的参考模型详细过程如下：

设观测的特征向量序列为O＝o₁,o₂,…,o_T，该序列的状态模型序列为S＝s₁,s₂,…,s_N，则该序列的HMM模型表示为表达式7)：

λ＝(π,A,B) 7)；

其中，π＝{π_i＝P(s₁＝i),i＝1,2,…,N}为初始状态概率矢量；A＝{a_ij}为状态间跳转的转移概率矩阵，a_ij为从状态i跳转到状态j的概率；B＝{b_i(o_t)＝P(o_t|s_t＝i),2≤i≤N‑1}为状态的输出概率分布集；

对连续HMM模型，观测序列为连续信号，其与状态j对应的信号空间用M个混合高斯密度函数的和来表示，如表达式8)和表达式9)下：

其中，c_jk表示状态j的第k个高斯混合密度函数的系数；μ_jk是高斯密度函数的均值向量；C_jk为协方差矩阵，D为观测序列O的维数；HMM参数由观测序列O＝o₁,o₂,…,o_T估计得到，估计的目标是使模型与训练数据的似然函数P(O|λ)最大化来估计最新的λ，即使

所述似然函数p(O|λ)的前向概率计算公式如表达式10)：

其中：α₁(i)＝πb_i(o₁),1≤i≤N；

所述似然函数p(O|λ)的后向概率计算公式如表达式11)：

其中：β_t(i)＝1,1≤i≤N；

对给定观测序列O＝o₁,o₂,…,o_T通过重估计得到最新的λ，在此定义ξ_t(i,j)为t时刻状态为s_i且t+1时刻状态为s_j的概率，由表达式12)得到：

在给定模型λ和观测序列O的条件下，状态s_i在时刻t的后验概率为表达式13)：

由此，HMM参数λ重估计如下：

在t时刻状态j第k个高斯混合分量的参数c_jk，μ_jk和C_jk由表达式14)、15)以及16)重新估计：