[发明专利]具有反馈指导的英语句子识别与评价系统及其方法有效
申请号: | 201210248276.2 | 申请日: | 2012-07-17 |
公开(公告)号: | CN102800314A | 公开(公告)日: | 2012-11-28 |
发明(设计)人: | 李心广;李苏梅;陈嘉华;沈东雄 | 申请(专利权)人: | 广东外语外贸大学;李心广;李苏梅;陈嘉华;沈东雄 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/14 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明;林伟斌 |
地址: | 510006 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 反馈 指导 英语 句子 识别 评价 系统 及其 方法 | ||
技术领域
本发明涉及语音识别与评价技术领域,特别涉及一种用于将人发出的语音信号识别后转变为相应的翻译结果,并给出客观评价和反馈指导的具有反馈指导的英语句子识别与评价系统。本发明还涉及该系统的语音识别与评价方法。
背景技术
语音识别技术就是让机器通过识别和理解,把人发出的语音信号转变为相应的文本或做出设定命令的技术,它正逐步成为信息技术中人机交互的关键技术。随着语音识别技术的进步,计算机辅助语音教学技术(Computer-assisted Language Learning,CALL)成为了研究的热门,它极大地提高语言学习效率,及时、准确、客观的评价和反馈帮助学习者找出自己发音与标准发音之间的差距,并纠正发音错误。因此,具有反馈指导的英语句子识别与评价系统有着巨大的发展潜力,可广泛适用于国内外旅游、国际展览会、国际体育赛事、宾馆服务以及语言学习等活动,使人与人之间的距离更近,交流更方便。
发明内容
本发明的目的在于设计具有反馈指导的英语句子识别与评价系统,实现英语句子的语音识别、口语翻译、客观评价和反馈指导等功能。此外,本发明具有语音识别时效率更高,识别准确率更高;语音评价时,评价指标更全面,客观评价和反馈指导准确客观,真实性和可信性高的特点。
本发明的另外一个目的在于提供该系统的语音识别与评价方法。
为了实现上述发明目的,本发明包括如下技术特征:一种具有反馈指导的英语句子识别与评价系统,其包括依次连接的语音采集模块、语音预处理模块、语音特征提取模块、语音识别模块、客观评价模块及反馈指导模块,还包括分别与语音识别模块、客观评价模块、反馈指导模块连接的标准语句模型库;
语音采集模块对语音信号进行采集;语音预处理模块对语音信号进行预加重、分帧、加窗、端点检测预处理;语音特征提取模块对语音信号进行语音特征参数的提取;语音识别模块、客观评价模块和反馈指导模块通过与标准语句模型库的匹配对语音信号进行语音识别、客观评价和反馈指导。
所述客观评价模块包括依次连接的语速评价单元、准确度评价单元、重音评价单元、节奏评价单元和语调评价单元,通过比较待评价语句和标准语句的语速、准确度、重音、节奏和语调进行综合评价;
所述语速评价单元通过计算待评价语句与标准语句的时长比,与所设置的语速阈值进行比较;
所述准确度评价单元采用短时能量作为特征来提取语句的强度曲线,进而采用抽查值的方法将待评价语句规整到与标准语句相近的程度,再将之与标准语音的强度曲线图进行对比,通过比较其拟合程度进行评价;
所述重音评价单元在规整后强度曲线图的基础上,设置重音阈值和非重音阈值作为特征的双门限以及重读元音时长,进行重音单元的划分;进而采用DTW算法对待评价语句和标准语句进行模式匹配;
所述节奏评价单元采用改进的dPVI参数计算公式,根据语音单元时长差异性的特征,将标准语句与待评价语句的音节单元片段时长分别进行对比计算,并转换出相对应的参数;
所述语调评价单元通过提取语句发音的共振峰并加以分析,进而通过判断共振峰在语音信号中的趋势来判断发音在语调方面的变化,再将之与标准语音的语调变化进行对比,最后通过比较语调的拟合程度进行评价。
同时,本发明还提供一种具有反馈指导的英语句子识别与评价方法,其包括以下步骤:
(1)语音采集模块对语音信号进行采集,并根据奈奎斯特采样定理将模拟信号数字化;
(2)语音预处理模块对所得的语音信号进行预加重、分帧、加窗、端点检测预处理;
(3)语音特征提取模块对预处理后的语音信号进行语音特征参数MFCC的提取;
(4)语音识别模块采用分段均值数据降维算法对所得的语音特征进行降维处理,然后通过与标准语句模型库的匹配,以语音和文本的形式输出识别结果;
(5)客观评价模块和反馈指导模块通过与标准语句模型库的匹配从语句的语速、准确度、重音、节奏和语调方面进行客观评价和反馈指导。
所述标准语句模型库包括标准语句的语音信号库、特征参数库、聚类分组库、HMM模型库和文本库。
标准语句模型库用于对语音信号进行语音识别、客观评价和反馈指导的模式匹配。语音信号库存储标准语句的语音信号,包括语音信号的强度曲线图、时长、重音、共振峰及标准发音;特征参数库存储标准语句的特征参数;聚类分组库存储标准语句的所属分组;HMM模型库存储标准语句的HMM模型;文本库存储标准语句的中英文文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东外语外贸大学;李心广;李苏梅;陈嘉华;沈东雄,未经广东外语外贸大学;李心广;李苏梅;陈嘉华;沈东雄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210248276.2/2.html,转载请声明来源钻瓜专利网。