[发明专利]语音测评方法、装置、计算机设备和存储介质在审
申请号: | 202110577532.1 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113763992A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 林炳怀;王丽园 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 陈小娜;杨欢 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 测评 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种语音测评方法、装置、计算机设备和存储介质。所述方法包括:获取待测评语音,并对待测评语音进行语音处理,得到时间对齐结果和待测评语音的音频特征;根据时间对齐结果和音频特征,确定与待测评语音对应的多个音素单元各自对应的目标音素特征;获取每个音素单元分别对应的发音特征,并将发音特征与相应的目标音素特征进行第一融合处理,得到每个音素单元各自对应的融合特征;确定待测评语音中每个整句所包括的语音音素,基于各整句各自包括的语音音素所属音素单元的融合特征进行第二融合处理,得到每个整句各自对应的语句特征;根据语句特征确定待测评语音的测评分值。采用本方法能够提升语音测评的测评效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种语音测评方法、装置、计算机设备和存储介质。
背景技术
目前,一些语言教学类应用程序能够对用户的口语发音进行评测,以帮助用户提高口语发音。语音测评一般分为两个步骤:1、将待测评语音进行短时傅里叶变换,进而转换为相应的语谱图,然后基于音频的工程特性,从语谱图提取GOP(goodness ofpronunciation,发音置信度参数)2、将提取得到的GOP输入至评测模块,得到对应的语音测评分数。
然而,由于GOP是对发音置信度的近似计算,因此GOP的计算复杂,往往需要经过复杂的计算步骤才能确定待测评语音的GOP,从而导致基于GOP所确定的语音测评分数的效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升语音测评效率的语音测评方法、装置、计算机设备和存储介质。
一种语音测评方法,所述方法包括:
获取待测评语音,并对所述待测评语音进行语音处理,得到时间对齐结果和所述待测评语音的音频特征;
根据所述时间对齐结果和所述音频特征,确定与所述待测评语音对应的多个音素单元各自对应的目标音素特征;
获取每个音素单元分别对应的发音特征,并将所述发音特征与相应的目标音素特征进行第一融合处理,得到每个音素单元各自对应的融合特征;
确定所述待测评语音中每个整句所包括的语音音素,基于各整句各自包括的语音音素所属音素单元的融合特征进行第二融合处理,得到每个所述整句各自对应的语句特征;
根据所述语句特征确定所述待测评语音的测评分值。
一种语音测评装置,所述装置包括:
音素特征确定模块,用于获取待测评语音,并对所述待测评语音进行语音处理,得到时间对齐结果和所述待测评语音的音频特征;根据所述时间对齐结果和所述音频特征,确定与所述待测评语音对应的多个音素单元各自对应的目标音素特征;
语句特征确定模块,用于获取每个音素单元分别对应的发音特征,并将所述发音特征与相应的目标音素特征进行第一融合处理,得到每个音素单元各自对应的融合特征;确定所述待测评语音中每个整句所包括的语音音素,基于各整句各自包括的语音音素所属音素单元的融合特征进行第二融合处理,得到每个所述整句各自对应的语句特征;
分值确定模块,用于根据所述语句特征确定所述待测评语音的测评分值。
在一个实施例中,所述音素特征确定模块还包括对齐结果确定模块,用于根据预设帧长对所述待测评语音进行分帧处理,得到对应的音频帧序列;提取所述音频帧序列中每个音频帧各自对应的音频特征,并通过预设的音素识别算法识别所述音频帧序列所包括的每个语音音素各自对应的起止时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110577532.1/2.html,转载请声明来源钻瓜专利网。