[发明专利]电子耳蜗汉语固定电刺激幅度变化模式体外语音处理装置有效
申请号: | 200810067315.2 | 申请日: | 2008-05-21 |
公开(公告)号: | CN101301240A | 公开(公告)日: | 2008-11-12 |
发明(设计)人: | 关添;徐涛;朱子俨;叶大田 | 申请(专利权)人: | 清华大学深圳研究生院 |
主分类号: | A61F11/04 | 分类号: | A61F11/04;A61N1/36;G10L15/14;G10L15/02;G10L15/04 |
代理公司: | 深圳市汇力通专利商标代理有限公司 | 代理人: | 王锁林 |
地址: | 518055广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 耳蜗 汉语 固定 刺激 幅度 变化 模式 体外 语音 处理 装置 | ||
技术领域
本发明涉及电子耳蜗恢复耳聋患者听觉领域,特别是一种适应汉语特征、结合汉语语音识别技术的电子耳蜗固定电刺激幅度变化模式体外语音处理装置及方法。
背景技术
电子耳蜗(也被称为耳蜗埋植、电子耳、仿生耳或人工耳蜗),是目前唯一能使全聋患者恢复听觉的装置。它依靠直接用微弱电流兴奋听神经纤维模仿外周听觉系统的生理功能,产生与正常人耳相似的神经发放模式,从而恢复患者的听觉。电子耳蜗可以帮助全聋患者恢复语言交流能力,增加他们接受教育、就业和社会交往的机会。尤其是聋儿,无论是语前聋还是语后聋,当借助于助听器仍然无法听到声音时,将导致他们终生失去获得正常教育的机会,给家庭和社会增加沉重的负担。电子耳蜗可以帮助他们重新获得音感,获取外界的信息和知识,成为对社会有益的人。
目前电子耳蜗产品中,大多数体外语音处理装置采用了摩托罗拉公司的DSP56000系列DSP。该系列DSP计算速度较慢,功耗较大,片内RAM过小,其自带外设接口扩展时结构复杂,并不十分适合要求高性能、低功耗的电子耳蜗体外语音处理装置。同时,现有产品所采用的语音信号处理方法都是基于英语特点开发的算法,主要符合了印欧语系的特点,而汉语作为汉藏语系之一,并不属于印欧语系的亲属语系,两者差异较大,这也是造成现有语音处理方法对于汉语的言语识别效果难以让我国患者满意的原因之一。因此,高性能、低功耗的电子耳蜗体外语音处理装置,以及充分利用汉语特性的、利用固定电刺激幅度变化模式编码传递汉语声调等丰富信息的电子耳蜗语音处理方法的开发就显得格外重要。
现有电子耳蜗产品体外语音处理采用的语音处理方法可分为两大类,一类是基于特征提取,即提取语音信号的基频和共振峰等特征,然后产生相应电极的刺激信号。一类是基于滤波器组的语音信号处理方法,即对语音信号进行分频段滤波处理。
汉语是单音节结构的语言,而英语是多音节结构。以《新华字典》第10版所收汉字为统计对象,汉语共有416个基础音节(不含音调),若考虑音调信息,则汉语共有标准音节(包含声调)1345个。因此,以标准音节作为语音识别单元对汉语语音进行识别,然后利用较高的语音识别率来提高电子耳蜗佩带者的言语识别能力是可行的;另一方面,汉语是一种声、韵、调语言,其中声调对于汉语的正确理解具有重要的意义。因此,利用加入声调作为识别特征进行汉语语音识别,进而利用刺激速率对声调特征进行编码,同样对于提高电子耳蜗佩带者的言语识别能力具有帮助。
发明内容
本发明的目的在于针对目前电子耳蜗存在的上述问题,提供一种电子耳蜗汉语固定电刺激幅度变化模式体外语音处理装置及方法,以更加有效地恢复我国耳聋患者的听力状况。
本发明电子耳蜗汉语固定电刺激幅度变化模式体外语音处理装置包括:
音频放大采样模块,用于将采集的语音信号转换为数字音频信号;
存储模块,它内部存储有语音信号处理程序;
数字信号处理器,它与音频放大采样模块和存储模块连接,通过运行存储模块内的语音信号处理程序对音频放大采样模块转换后的数字音频信号处理,输出相应的电刺激参数;以及,
信号传输模块,它与数字信号处理器连接,用于将所述电刺激参数传输给配套的电子耳蜗体内部分;
所述语音信号处理程序包括:
预处理单元,用于对音频放大采样模块转换后的数字音频信号进行采样、分帧;
端点检测单元,用于从预处理后的每帧信号中获取语音段;
语音识别单元,用于对语音段识别;以及,
特征编码单元,用于对语音识别的结果进行电刺激编码,它具有:
固定电刺激幅度变化模式库,它内部存储有与包含声调信息的所有汉语标准音节一一对应的固定电刺激幅度变化模式;以及,
刺激模式选择调整模块,它根据语音识别单元对语音段的识别结果,从固定电刺激模式库中选出对应的电刺激幅度变化模式,并分别根据语音识别结果的声母发声频率、声调信息、音长信息对电极通道选择模式、刺激速率变化模式、刺激时间进行调整,最终生成对应各个刺激电极的完整电刺激参数。
进一步,语音识别单元采用基于隐马尔可夫模型(HMM)的非特定人、中等词汇量的连续语音识别算法。该语音识别单元包含:
语音特征提取模块,该模块用于从语音段中提取MFCC(Mel频率倒谱系数)和一阶差分MFCC作为该语音段的特征向量;
矢量量化模块,该模块根据由语音库训练得出的码本将从语音段提取的特征向量做一次矢量量化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810067315.2/2.html,转载请声明来源钻瓜专利网。