[发明专利]具有反馈指导的英语句子识别与评价系统及其方法有效
申请号: | 201210248276.2 | 申请日: | 2012-07-17 |
公开(公告)号: | CN102800314A | 公开(公告)日: | 2012-11-28 |
发明(设计)人: | 李心广;李苏梅;陈嘉华;沈东雄 | 申请(专利权)人: | 广东外语外贸大学;李心广;李苏梅;陈嘉华;沈东雄 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/14 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明;林伟斌 |
地址: | 510006 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 反馈 指导 英语 句子 识别 评价 系统 及其 方法 | ||
1.一种具有反馈指导的英语句子识别与评价系统,其特征在于:包括依次连接的语音采集模块、语音预处理模块、语音特征提取模块、语音识别模块、客观评价模块及反馈指导模块,还包括分别与语音识别模块、客观评价模块、反馈指导模块连接的标准语句模型库;
语音采集模块对语音信号进行采集;语音预处理模块对语音信号进行预加重、分帧、加窗、端点检测预处理;语音特征提取模块对语音信号进行语音特征参数的提取;语音识别模块、客观评价模块和反馈指导模块通过与标准语句模型库的匹配对语音信号进行语音识别、客观评价和反馈指导。
2.根据权利要求1所述的具有反馈指导的英语句子识别与评价系统,其特征在于:所述客观评价模块包括依次连接的语速评价单元、准确度评价单元、重音评价单元、节奏评价单元和语调评价单元,通过比较待评价语句和标准语句的语速、准确度、重音、节奏和语调进行综合评价。
3.根据权利要求2所述的具有反馈指导的英语句子识别与评价系统,其特征在于:
所述语速评价单元通过计算待评价语句与标准语句的时长比,与所设置的语速阈值进行比较;
所述准确度评价单元采用短时能量作为特征来提取语句的强度曲线,进而采用抽查值的方法将待评价语句规整到与标准语句相近的程度,再将之与标准语音的强度曲线图进行对比,通过比较其拟合程度进行评价;
所述重音评价单元在规整后强度曲线图的基础上,设置重音阈值和非重音阈值作为特征的双门限以及重读元音时长,进行重音单元的划分;进而采用DTW算法对待评价语句和标准语句进行模式匹配;
所述节奏评价单元采用改进的dPVI参数计算公式,根据语音单元时长差异性的特征,将标准语句与待评价语句的音节单元片段时长分别进行对比计算,并转换出相对应的参数;
所述语调评价单元通过提取语句发音的共振峰并加以分析,进而通过判断共振峰在语音信号中的趋势来判断发音在语调方面的变化,再将之与标准语音的语调变化进行对比,最后通过比较语调的拟合程度进行评价。
4.一种具有反馈指导的英语句子识别与评价方法,其特征在于:包括以下步骤:
(1)语音采集模块对语音信号进行采集,并根据奈奎斯特采样定理将模拟信号数字化;
(2)语音预处理模块对所得的语音信号进行预加重、分帧、加窗、端点检测预处理;
(3)语音特征提取模块对预处理后的语音信号进行语音特征参数MFCC的提取;
(4)语音识别模块采用分段均值数据降维算法对所得的语音特征进行降维处理,然后通过与标准语句模型库的匹配,以语音和文本的形式输出识别结果;
(5)客观评价模块和反馈指导模块通过与标准语句模型库的匹配从语句的语速、准确度、重音、节奏和语调方面进行客观评价和反馈指导。
5.根据权利要求4所述的具有反馈指导的英语句子识别与评价方法,其特征在于:所述标准语句模型库包括标准语句的语音信号库、特征参数库、聚类分组库、HMM模型库和文本库。
标准语句模型库用于对语音信号进行语音识别、客观评价和反馈指导的模式匹配。语音信号库存储标准语句的语音信号,包括语音信号的强度曲线图、时长、重音、共振峰及标准发音;特征参数库存储标准语句的特征参数;聚类分组库存储标准语句的所属分组;HMM模型库存储标准语句的HMM模型;文本库存储标准语句的中英文文本。
6.根据权利要求5所述的具有反馈指导的英语句子识别与评价方法,其特征在于:聚类分组库和HMM模型库采用分段均值数据降维算法、聚类模型交叉分组算法、HMM模型聚类分组技术和Viterbi算法进行语音特征降维、分组建模和模型匹配;所述分段均值数据降维算法解决语音特征参数维度较高和不同长度问题,聚类模型交叉分组算法解决分组性能较低问题,HMM模型聚类分组技术解决Viterbi算法运算量和混合高斯分布概率计算量大问题,Viterbi算法解决HMM的解码问题。
7.根据权利要求6所述的具有反馈指导的英语句子识别与评价方法,其特征在于:步骤(4)具体还包括如下步骤:
(a)采用分段均值数据降维算法对语音特征提取模块得到的语音特征进行降维处理;
(b)通过与标准语句模型库的匹配,利用改进的DTW算法确定语音特征聚类分组K;
(c)对第K组内的HMM模型参数进行计算:将语音特征参数作为隐马尔可夫模型的观察序列;训练得到的语音单元为状态序列,通过Viterbi算法解出状态转移序列;
(d)采用决策判决,得到最大概率的状态转移序列;
(e)通过与标准语句模型库的匹配,根据最佳状态序列对应出英语句子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东外语外贸大学;李心广;李苏梅;陈嘉华;沈东雄,未经广东外语外贸大学;李心广;李苏梅;陈嘉华;沈东雄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210248276.2/1.html,转载请声明来源钻瓜专利网。