[发明专利]提高口语评测性能的方法及系统有效
申请号: | 201310553383.0 | 申请日: | 2013-11-08 |
公开(公告)号: | CN103594087B | 公开(公告)日: | 2016-10-12 |
发明(设计)人: | 高前勇;魏思;胡国平;刘丹;陈进;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/03;G10L25/48 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提高 口语 评测 性能 方法 系统 | ||
技术领域
本发明涉及语音信号处理技术领域,具体涉及一种提高口语评测性能的方法及系统。
背景技术
作为人际交流的重要媒介,口语语言在实际生活中占有极其重要的地位。随着社会经济的不断发展和全球化趋势的加剧,人们对语言学习的效率以及语言评估的客观性、公正性和规模化测试提出了越来越高的要求。传统的人工口语水平评测方法使教师和学生在教学时间和空间上受到很大限制,在师资力量、教学场地、经费支出等方面也存在诸多硬件上的差距和不平衡;人工评测无法避免评估者自身的个体偏差,从而不能保证评分标准的统一,有时甚至无法准确反映被测者的真实水平;而对于大规模口语测试,则需要大量的人力、物力和财力支持,限制了经常性、规模性的评估测试。为此,业界相继开发出了一些语言教学和评测系统。
口语评测主要涉及到两类题型,即朗读题型和半开放题型。其中,朗读题型是指要求用户朗读预设文本借以考察用户对基本语音单元发音的标准程度及语句朗读的流利程度;半开放题型是指由系统播放图像、视频或者短文等提示内容,并根据这些提示内容要求用户回答相关问题或口语复述播放内容等的测试项目。
对于半开放题型的口语评测,现有技术中主要是利用自动语音识别技术对用户语音内容进行文本识别,然后根据识别结果统计关键词汇和短语命中率等特征进行相关评分。由于半开放题型的口语评测标准主要在于判断关键词汇和短语是否出现语法错误,因此对待评测语音进行语音识别获取正确的识别结果显得尤为重要,如何提高在半开放性题型口语评测中语音识别结果的正确率是亟待解决的一个重要问题。
发明内容
本发明实施例提供一种提高口语评测性能的方法及系统,以提高口语评测的准确性。
为此,本发明提供如下技术方案:
一种提高口语评测性能的方法,包括:
接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;
根据所述朗读题语音数据对各朗读题进行评分;
从评分结果中获取自适应有效数据;
根据所述自适应有效数据对预设的声学模型进行优化;
利用优化后的声学模型对各半开放题进行评分。
优选地,所述根据所述朗读题语音数据对各朗读题进行评分包括:
将所述朗读题语音数据与所述朗读题的题面文本信息进行字音对齐,获取文本字串中各基本语音单元对应的语音信号片段;
计算所述基本语音单元与其对应的语音信号片段的似然度;
根据所述似然度统计所述基本语音单元与其对应的语音信号片段的后验概率;
根据所述后验概率计算各朗读题的得分。
优选地,所述从评分结果中获取自适应有效数据包括:
选择得分高于设定的第一门限的朗读题的语音数据作为自适应有效数据。
优选地,所述方法还包括:
在根据所述自适应有效数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理,包括:
分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合;
依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应语句;
所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应语句对预设的声学模型进行优化。
优选地,所述从评分结果中获取自适应有效数据包括:
选择后验概率高于设定的第二门限的基本语音单元对应的语音数据作为自适应有效数据。
优选地,所述方法还包括:
在根据所述自适应有效数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理,包括:
分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合;
依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应基本语音单元;
所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应基本语音单元对预设的声学模型进行优化。
优选地,所述根据所述自适应有效数据对预设的声学模型进行优化包括:
采用基于最大似然线性回归的自适应方式对预设的声学模型进行优化;或者
采用基于最大后验概率的自适应方式对预设的声学模型进行优化。
一种提高口语评测性能的系统,包括:
接收模块,用于接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310553383.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信道映射方法和装置
- 下一篇:未授权频带中的TD LTE辅分量载波