[发明专利]语音评估方法、装置、计算机设备和存储介质在审
申请号: | 202111467617.0 | 申请日: | 2021-12-02 |
公开(公告)号: | CN116230017A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 肖易明;易高雄 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/30 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 评估 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种云技术的语音评估方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:对原始语音进行语音活动检测,得到对应的待测语音;对所述待测语音进行时频转换处理,并对时频转换处理所得到的语音信号进行特征提取,得到所述待测语音对应的声学特征;对所述声学特征进行卷积处理,得到不同时刻的深度特征;基于所述不同时刻的深度特征进行质量评估处理,得到所述原始语音对应的质量评估结果。采用本方法能够有效对线上的实时语音进行质量监控和质量评估。
技术领域
本申请涉及计算机技术领域,特别是涉及一种语音评估方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,出现了语音质量评估技术。语音质量评估技术用于对语音的质量进行检测,以应用在语音合成、语音转换和语音增强等多个场景。
传统的语音质量评估技术往往使用有参考的语音质量评估方法,有参考的语音质量评估方法首先对参考语音以及损伤语音进行电平调整以及时间对齐,以确保两者之间的差异仅为质量不同所导致,随后对上述语音对做听觉转换,最后对比两者听觉转换后之间的差距估计出待测语音质量分数。可见,有参考的语音质量评估方法需要无损参考语音作为对比,计算损伤语音信号与参考信号之间的差距,才能估计出相应分数。
然而,目前的有参考语音质量评估方法需要无损的参考信号作为参考,而这在实际场景中难以获取,因而该方法只能线下评估而无法实现线上的语音质量实时评估。
发明内容
基于此,有必要针对上述技术问题,提供一种能够进行实时评估的语音评估方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
本申请提供了一种语音评估方法,所述方法包括:
对原始语音进行语音活动检测,得到对应的待测语音;
对所述待测语音进行时频转换处理,并对时频转换处理所得到的语音信号进行特征提取,得到所述待测语音对应的声学特征;
对所述声学特征进行卷积处理,得到不同时刻的深度特征;
基于所述不同时刻的深度特征进行质量评估处理,得到所述原始语音对应的质量评估结果。
本申请还提供了一种语音评估装置,所述装置包括:
检测模块,用于对原始语音进行语音活动检测,得到对应的待测语音;
转换模块,用于对所述待测语音进行时频转换处理,并对时频转换处理所得到的语音信号进行特征提取,得到所述待测语音对应的声学特征;
卷积模块,用于对所述声学特征进行卷积处理,得到不同时刻的深度特征;
处理模块,用于基于所述不同时刻的深度特征进行质量评估处理,得到所述原始语音对应的质量评估结果。
在一个实施例中,所述检测模块,还用于对原始语音进行分帧处理,得到对应的各帧语音信号;确定每帧所述语音信号分别对应的短时能量和短时过零率;基于所述短时能量和所述短时过零率,从各帧所述语音信号中筛选出有效信号帧,以获得待测语音。
在一个实施例中,所述检测模块,还用于对每帧所述语音信号分别进行加窗处理,并对加窗处理后的语音信号进行时频转换处理,得到对应的频谱;基于每帧所述语音信号分别对应的频谱,确定每帧所述语音信号的短时能量;获取每帧所述语音信号分别对应的时域波形,基于所述时域波形确定各自对应语音信号的短时过零率。
在一个实施例中,所述卷积模块,还用于对所述声学特征进行分帧处理,得到不同时刻的特征帧;对所述不同时刻的特征帧进行卷积处理和归一化处理,得到不同时刻的深度特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111467617.0/2.html,转载请声明来源钻瓜专利网。