[发明专利]语音质量评估方法、系统、计算机可读存储介质有效

申请号：	202110950617.X	申请日：	2021-08-18
公开（公告）号：	CN113689883B	公开（公告）日：	2022-11-01
发明（设计）人：	高旭博	申请（专利权）人：	杭州雄迈集成电路技术股份有限公司
主分类号：	G10L25/60	分类号：	G10L25/60;G10L25/51
代理公司：	杭州裕阳联合专利代理有限公司 33289	代理人：	杨琪宇
地址：	311400 浙江省杭州市富阳***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音质量评估方法系统计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音质量评估方法，其特征在于包括以下步骤：

获取降噪信号和与所述降噪信号相对应的参考信号，所述降噪信号包括若干降噪信号帧，所述参考信号包括与所述降噪信号帧一一对应的参考信号帧；

基于参考信号帧，计算各降噪信号帧的语音清晰度，获得相应的帧清晰度；

基于声音分贝值对各参考信号帧进行分组，并基于分组结果对各降噪信号帧进行分组，获得若干个降噪信号帧集；

基于降噪信号帧集中各降噪信号帧的帧清晰度，计算各降噪信号帧集所对应的语音清晰度，获得相应的段清晰度；

对各段清晰度进行加权计算，获得所述降噪信号的语音清晰度；

其中，基于参考信号帧，计算各降噪信号帧的语音清晰度，获得相应的帧清晰度的具体步骤为：

计算参考信号和降噪信号之间的幅度平方相干度；

计算所述降噪信号的能量谱密度数据；

获取预设的听觉滤波器，所述听觉滤波器设有若干个临界频带；

基于所述幅度平方相干度、所述能量谱密度数据和所述听觉滤波器计算降噪信号帧在各临界频带上的信噪比失真率；

基于所述信噪比失真率计算各降噪信号帧的语音清晰度，获得相应的帧清晰度。

2.根据权利要求1所述的语音质量评估方法，其特征在于，计算所述信噪比失真率的公式为：

；

其中，SDR表示M个降噪信号帧分别在J个临界频带上的信噪比失真率，M表示降噪信号帧的总帧数，W_j表示听觉滤波器，表示幅度平方相干度，S_yy（k）表示能量谱密度数据，K表示频点的总数，k表示频点下标。

3.根据权利要求2所述的语音质量评估方法，其特征在于，计算所述幅度平方相干度的公式为：

其中， M为降噪信号帧或参考信号帧的总帧数，m指示帧下标，X表示参考频谱数据，X_m表示帧下标为m的参考信号帧所对应的频谱数据，Y表示降噪频谱数据，Y_m表示帧下标为m的降噪信号帧所对应的频谱数据，“*”表示复数的共轭操作。

4.根据权利要求1至3任一所述的语音质量评估方法，其特征在于：

基于声音分贝值将参考信号帧分为若干组，获得相应的参考信号帧集；

基于所述参考信号帧集对降噪信号帧进行分组，获得与所述参考信号帧集一一对应的降噪信号帧集。

5.根据权利要求4所述的语音质量评估方法，其特征在于：

计算各参考信号帧的声音分贝值；

获取预设的分贝阈值，所述分贝阈值包括第一分贝阈值和第二分贝阈值，其中第一分贝阈值大于所述第二分贝阈值；

提取声音分贝值大于所述第一分贝阈值的参考信号帧，获得第一参考信号帧集；

提取声音分贝值小于等于所述第一分贝阈值，且大于等于所述第二分贝阈值的参考信号帧，获得第二参考信号帧集；

提取声音分贝值小于所述第二分贝阈值的参考信号帧，获得第三参考信号帧集。

6.根据权利要求5所述的语音质量评估方法，其特征在于：

所述第一分贝阈值为0db，所述第二分贝阈值为-10db。

7.根据权利要求5或6所述的语音质量评估方法，其特征在于：

计算各参考信号帧的短时平均幅度，获得相应的帧幅度数据；

基于所述帧幅度数据，计算各参考信号帧集所对应的整体短时平均幅度，获得段幅度数据；

基于所述段幅度数据计算各参考信号帧集所对应的清晰度权重；

基于所述段清晰度和所述清晰度权重进行加权计算，获得降噪信号的语音清晰度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州雄迈集成电路技术股份有限公司，未经杭州雄迈集成电路技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110950617.X/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载