[发明专利]一种语音测评方法及装置在审
申请号: | 202110088940.0 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112767919A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 黄智超;陈现麟;王强 | 申请(专利权)人: | 北京读我科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L25/03;G10L25/51 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 尹秀 |
地址: | 100088 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 测评 方法 装置 | ||
本发明公开了一种语音测评方法及装置,所述方法包括:提取评测语音的各个特征,将各个特征展开成各个音素,评测语音是针对给定文本的发音,给定文本至少包含一个单词;将评测语音与给定文本进行强制对齐,确定给定文本中各个单词的第一起始时间和第一结束时间以及各个音素的第二起始时间和第二结束时间;针对每一个当前音素基于第二起始时间和第二结束时间确定其对应的目标音素;基于第一起始时间和第一结束时间将每个单词中目标音素与当前音素不同的字母或者字母组合进行区别显示。上述过程,在对评测语音进行语音测评时,将评测语音中的各个特征展开成各个音素,对评测语音中的单词正误基于音素级别进行区分显示,实现了音素级别的语音测评。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音测评方法及装置。
背景技术
少儿英语教育的自然拼读课中,会教授孩子如何根据字母拼读出单词,为了验证孩子们的学你成果,需要对孩子进行测评,检测是否拼读正确,这就要求测评系统对能对学生语音进行打分。
但是,单纯针对语音进行打分,不能检测出针对每一个单词中的对应字母或者字母组合中的因素发音是否准确,因此,亟需提供一种音素级别的语音测评方法,基于可视化的角度告诉学生哪个音素发音错误,并且是哪一个或者哪几个字母发这个音。
发明内容
有鉴于此,本发明提供了一种语音测评方法及装置,用于实现基于音素级别的语音测评,具体方案如下:
一种语音测评方法,包括:
提取评测语音的各个特征,将所述各个特征展开成各个音素,其中,所述评测语音是针对给定文本的发音,所述给定文本至少包含一个单词;
将所述评测语音与所述给定文本进行强制对齐,确定所述给定文本中各个单词的第一起始时间和第一结束时间以及所述各个音素的第二起始时间和第二结束时间;
针对每一个当前音素基于所述第二起始时间和所述第二结束时间确定其对应的目标音素;
基于所述第一起始时间和所述第一结束时间将每个单词中所述目标音素与所当前音素不同的字母或者字母组合进行区别显示。
上述的方法,可选的,提取评测语音的各个特征,将所述各个特征展开成各个音素,包括:
对所述评测语音进行分帧,得到各个特征;
将所述各个特征按字典展开成各个音素。
上述的方法,可选的,所述评测语音进行强制对齐,确定所述评测语音中各个单词的第一起始时间和第一结束时间以及所述各个音素的第二起始时间和第二结束时间,包括:
确定所述评测语音的文本,将所述文本转换成音素序列;
确定所述音素序列中每个音素的状态,基于各个状态确定所述评测语音中各个单词的第一起始时间和第一结束时间以及所述各个音素的第二起始时间和第二结束时间。
上述的方法,可选的,针对每一个当前音素基于所述第二起始时间和所述第二结束时间确定其对应的目标音素,包括:
将所述第二起始时间和所述第二结束时间传递给声学模型进行计算,得到全部音素的后验概率;
在各个后验概率终端区概率值最高的后验概率作为目标后验概率,将所述目标后验概率对应的音素作为目标音素。
上述的方法,可选的,基于所述第一起始时间和所述第一结束时间将每个单词中所述目标音素与所当前音素不同的字母或者字母组合进行区别显示,包括:
基于所述第一起始时间和所述第一结束时间确定所述评测语音中的各个单词;
针对每一个单词,基于最大期望算法将音素与字母或者字母组合建立对应关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京读我科技有限公司,未经北京读我科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110088940.0/2.html,转载请声明来源钻瓜专利网。