[发明专利]一种口语测评方法、装置及一种生成口语测评模型的装置有效
| 申请号: | 201811422784.1 | 申请日: | 2018-11-27 |
| 公开(公告)号: | CN109272992B | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 夏龙;高强;吴凡;陈冬晓;马楠;崔成鹏;郭常圳 | 申请(专利权)人: | 北京猿力未来科技有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/51 |
| 代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
| 地址: | 100102 北京市朝阳区广顺南大*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 口语 测评 方法 装置 生成 模型 | ||
1.一种口语测评方法,应用于口语测评系统的数据处理端,其特征在于,包括:
获取待测评语音数据;
对所述待测评语音数据进行语音结束检测;
对语音结束检测后的待测评语音数据进行声道长度归一化处理;
对经过声道长度归一化处理的待测评语音数据进行语音识别得到待测评语音数据的语音帧序列以及与语音帧序列对应的转换文本;
将所述转换文本与参考文本进行强制对齐处理,并生成强制对齐信息,所述强制对齐信息包括转换文本的语音帧序列与所述参考文本的语音帧序列的对应关系;
提取所述待测评语音数据的口语属性特征信息;
基于预先生成的口语测评模型根据所述待测评语音数据的口语属性特征信息得到打分结果;
所述获取待测评语音数据包括:
获取初始语音数据;其中,所述初始语音数据为出现语音叠加或交替现象的语音数据;
采用基于深度聚类的语音分离方法,从所述初始语音数据中提取目标语音数据作为待测评语音数据。
2.根据权利要求1中所述的口语测评方法,其特征在于,对所述待测评语音数据进行语音结束检测包括:
对所述待测评语音数据识别,并将识别后的所述待测评语音数据转换为包含时间信息的待结束检测语音文本;
根据所述参考文本与所述待结束检测语音文本进行匹配获取匹配文本时间点;
根据预设的语音活动检测方法及所述匹配文本时间点确定所述待测评语音数据的结束时间点。
3.根据权利要求2所述的口语测评方法,其特征在于,
所述口语属性特征信息包括:
发音属性特征信息;
语调属性特征信息;
以及流利度属性特征信息。
4.根据权利要求3所述的口语测评方法,其特征在于,所述口语属性特征信息还包括:单词标注特征信息;
在所述生成强制对齐信息之后,还包括:
根据强制对齐信息,判断所述转换文本与所述参考文本是否匹配,若否,则对参考文本中不相匹配的单词添加单词标注特征信息。
5.根据权利要求1所述的口语测评方法,其特征在于,所述获取待测评语音数据包括:
获取分片压缩后的语音数据;
对分片压缩后的语音数据进行解压处理得到待测评语音数据。
6.根据权利要求1所述的口语测评方法,其特征在于,在所述强制对齐处理的过程中,采用带有克林闭包的解码图将待测评语音数据中重复出现的语音数据进行过滤。
7.一种生成口语测评模型的方法,其特征在于,包括:
根据口语训练样本组生成口语训练样本集,每个所述口语训练样本组包含口语训练样本,每个所述口语训练样本包括口语属性特征信息和所述口语属性特征信息对应的打分结果,其中,所述口语属性特征信息利用权利要求1-6任一项所述口语测评方法得到;
根据所述口语训练样本集对口语测评模型进行训练,所述口语测评模型使得每个所述口语训练样本的口语属性特征信息与对应的打分结果相关联。
8.根据权利要求7所述的生成口语测评模型的方法,其特征在于,所述根据所述口语训练样本集对口语测评模型进行训练之前包括:
对所述口语训练样本的语音数据进行声道长度归一化处理,以将所有的口语训练样本组中口语训练样本的声道长度统一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811422784.1/1.html,转载请声明来源钻瓜专利网。





