[发明专利]一种测定感知参数的区分性的方法以及系统在审

申请号：	201410448867.3	申请日：	2014-09-04
公开（公告）号：	CN104183236A	公开（公告）日：	2014-12-03
发明（设计）人：	解焱陆;张劲松	申请（专利权）人：	北京语言大学
主分类号：	G10L15/00	分类号：	G10L15/00;G10L25/48;G09B19/04
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	汤在彦
地址：	100083***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种测定感知参数区分方法以及系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明关于语音处理技术，特别是关于计算机辅助语音设备中的语音识别技术，具体的讲是一种测定感知参数的区分性的方法以及系统。

背景技术

上世纪90年代以来，基于语音处理技术的计算机辅助发音教学(Computer-Aided Pronunciation Training，CAPT)设备不断被用于语言教学中。计算机辅助发音教学系统大致分为发音质量评价和发音错误检测。发音质量评价是指计算机自动评估学习者发音的质量好坏，适合用于对发音者的整体语言发音能力进行评判。而发音错误检测是指利用计算机自动指出学习者发音中的具体错误，如前鼻音发成了后鼻音，可以告诉学习者更多的反馈信息，如具体的口形，舌位等的改正方法。发音错误检测更加适合语言学习者发音学习中的发音错误检测和矫正，特别是在有了一定口语发音基础之上的反馈和改正。

发音错误检测技术虽然取得了一定进展，对于有些错误的检测可以接近于人工标注的水平，但还有部分错误发音难以检测出，即错误接受率过高，难以将该系统真正用于指导学生纠正发音偏误。造成这一问题主要有：(1)、不同的偏误所表现的区分特征参数往往不同。如日本人学习汉语的sh、x，即舌页化偏误，梅尔频率倒谱系数MFCC有显著差别，用该参数能较好的检测出偏误；而送气音的偏误，其MFCC和基频等常用参数都没有显著差异，嗓音起始时间VOT反而差别较大。这就造成很多偏误难以使用传统的参数检测出。(2)、发音偏误具有多样性和复杂性的特点。以汉语为例，日本人学习汉语，通常会出现送气音、不送气音混淆，前后鼻音混淆，阳平、上声声调混淆等，而英语母语学习者往往出现阴平、去声声调混淆。

针对上述问题，国内外学者根据评测任务的不同提出了多种改进方法。大致可以分为如下三类：

1、根据经验以实验结果为依据选取新的、对特定发音错误区分力强的参数。如Strik在MFCC之外，使用了基于上升速率曲线ROR曲线的相关特征进行荷兰语音素摩擦音/x/和爆破音/k/的偏误检测。Doremalen在MFCC之外，使用了基频、共振峰以及ASR音段置信值特征，该特征是从强制对齐结果的帧后验概率中计算得到的，比较了荷兰语的元音发音偏误检测效果。Tongmu Zhao采用结构化的参数和SVM模型自动检测汉语发音偏误。为了评估发音韵律的好坏，中科院自动化所的黄申使用了基频、语速、Fujisaki模型参数和成对辅音变异指数rPVI、成对元音变异指数nPVI等节奏参数判断发音韵律。中科院声学所的董滨根据能量分布的不同，以能量集中带为特征，以SVM模型区分汉语中的平舌音和翘舌音，取得了98.35％的正确率。上述第一类方法往往要进行大量的发音错误检测实验，以实验结果判定哪种参数更优。

2、从众多的参数中以机器学习方法筛选出最合适的。如Stouten通过神经网络从短时MFCC中提取包含音源信息、元辅音信息等的多维语音学特征参数，用于英语的音素发音错误检测。Lin-Shan Lee使用了混合语言训练的神经网络提取特征参数，致力于无监督的发现发音错误类型。Hacker通过ADABOOST方法从发音特征和韵律特征中选取性能最优的15维参数，进而利用GOP法对德国儿童的英语发音进行错误检测。上述第二类方法更依赖于参数选择模型的好坏，需要提取多种参数，较为繁琐。

3、从语言感知的本质出发，以汉语区别特征系统为基础找寻区分性参数。如张家騄根据汉语语音知觉混淆的群集分析结果，从声学和生理特性角度提出了声韵调体系的区别特征系统。语音评测任务中所针对的发音错误，大多发生在区别特征所表示的最小对立体之间。这一研究结果为如何选取区分性的发音错误检测特征提供了语音学的思路，但无法直接用在识别系统中。上述第三类方法虽然从感知出发，研究结果虽然反应了客观的语音问题，但结论过于细碎，难以总结出统计性的可供语言工程直接使用的参数选择经验。

发明内容

为了克服现有技术中的三种改进方法存在的上述技术缺陷，本发明提供了一种测定感知参数的区分性的方法及系统，基于现有实验语音学研究结果确定出不同测评任务需要检测的对立体对，并结合感知参数合成连续统合成语音，进而根据确定出的感知曲线测定感知参数的区分性，是一种精确测定感知参数的区分性的方案，可以准确快速的测定出各个感知参数的区分性，为后续针对不同的评测任务结合各个感知参数的区分性进行发音偏误检测提供了依据，且提高了各种发音偏误检测的准确性。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京语言大学;，未经北京语言大学;许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410448867.3/2.html，转载请声明来源钻瓜专利网。

上一篇：静态随机存储器结构
下一篇：语音信号的处理、实现多方通话的方法及装置、通信终端

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种测定感知参数的区分性的方法以及系统在审

专利文献下载