[发明专利]一种基于肌电信号的辅助发声方法及装置有效
申请号: | 201110267287.0 | 申请日: | 2011-09-09 |
公开(公告)号: | CN102999154A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 理华;孟晓辉;肖灵 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G09B21/00 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;高宇 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电信号 辅助 发声 方法 装置 | ||
技术领域
本发明涉及一种基于肌电信号的辅助发声方法,特别地,涉及一种基于肌电信号的辅发声方法及装置。
背景技术
根据2006年进行的第二次残疾人抽样调查结果推算,全国言语残疾人口127万,占1.53%。发声障碍会严重影响生活质量,造成沟通的不便,而且对家庭和社会来说都是沉重的负担。
发声障碍的病因分为两大类-器质性的和非器质性的。器质性的发声障碍源于患者喉部的疾病,特别是半喉和全喉的切除术会导致患者发声功能的丧失;非器质性发音障碍多是由精神因素引起的失声。
非器质性发音障碍又称心因性发音障碍,其表现为程度不同的嗓音嘶哑,喉头检查阴性,咳嗽、笑或清嗓子时声音接近正常。目前的治疗方法是:除发音训练外,结合精神上的照顾开导,适当选用暗示或诱导治疗,治疗恢复时间比较慢。
器质性的发声障碍失去了发音器官,动力器官肺虽存在,但气体的交换通过气管造瘘口进行,不经咽腔和鼻腔。目前,主要有3种辅助发声方法即食管音、气管食管音和人工喉。1)食管音的缺点是发音连贯性差,声时短,音调低,只适合在小范围、背景安静的环境中交流。发音不当常可引起腹胀及烧心感。2)气管食管音包括外瘘法和内瘘法。外瘘法手术过程复杂,外装置给病人造成不便,设计原理不适合颈部廓清手术和放疗后的患者,并发症如误吸仍难避免;内瘘法发音时需要用手堵住气管造瘘口,同时并发症也越来越引起人们的重视,其长期发音效果还需观察。3)人工喉的优点是设备简单,发出的声音声时长、响亮,可作长时间交谈。据统计,使用人工喉的患者,3年和5年后仍有57%的和50%的人在继续使用,高于食管音和气管食管音。其缺点是使用不甚方便,交谈时宛如手持烟斗一样需要用手将其固定,讲话时不能双手同时工作;而且发音的音质单调、刺耳,带有金属音。
目前,其它的辅助发声方法还有:
美国犹他大学科学家利用两组植入癫痫患者大脑中的微电极阵列成功实现将大脑信号转化为口语单词。这一成果能够帮助因患严重麻痹症而失去语言能力的患者轻松地表达自己的思想。这种微电极阵列每组包括16个微电极,通常植入到头骨之下,大脑之上。这项发明证明了大脑信号解码为计算机发音的口语单词的可行性。但是这种方法的手术难度很大,危险性高。
美国的AUDEO家公司从事脑电波方案的研究,通过传感器提取患者发声的脑电波信号进行判别,此产品的技术复杂度更高,只是用于英语发音,也处于试用阶段。
中科院计算所采用手语合成技术来辅助发声障碍的患者进行说话,普通人和聋哑人的交流需要通过电脑来完成。电脑的屏幕上有一个虚拟人,它能将输入的每一句话都用手语翻译出来,而聋哑人只要戴上一个特制的手套,他的手语也马上变成了屏幕上的一行行文字。这种方案的优点是聋哑人群均适用,缺点是讲话时双手不能工作,识别率低,仍处于科研阶段。
发明内容
本发明的目的是,针对上述辅助发声方法的缺点,结合发声障碍者的需求,提供一种使用安全、方便美观、学习时间短、发声效果好的辅助发声方法,即本发明提供一种基于肌电信号的辅助发声方法及装置。
为了实现上述目的,本发明提供一种基于肌电信号的辅助发声方法,该方法基于发声方面的机能,包含:
用于获得利用肌电信号辅助发声所需的先验知识库的步骤。
用于基于先验知识库识别“发声”动作对应的词语或汉字,并对汉字或词语进行语音合成的步骤。
可选的,所述的先验知识库采用如下方法获得:
1)对要学习的汉字或词语进行“发声”,采集该“发声”动作引起的相关的肌肉运动,产生表面肌电信号。
2)将“发声”相关的表面肌电信号传输给表面肌电信号的筛选与分离模块。
3)表面肌电信号的筛选与分离模块对肌电信号进行滤波、归一化和盲源分离处理,提取出与此汉字或词语“发声”相关的肌电语音信号。
4)语音肌电信号识别模块提取肌电语音信号的特征值,利用神经网络和支持向量机技术,建立肌电语音信号与汉字或词语“发声”之间的对应关系,将此关系保存下来。
5)多次重复上述步骤,最终获得先验知识库。
可选的,所述基于先验知识库识别“发声”动作对应的词语或汉字的过程包含如下步骤:
1)执行“发声”动作。
2)采集该“发声”动作对应的颈部或面部附近与语音相关位置的相关的表面肌电信号并将其传输给表面肌电信号的筛选与分离模块。
3)表面肌电信号的筛选与分离模块对表面肌电信号进行滤波、归一化和盲源分离算法进行处理,以滤除表面肌电信号中包含的眨眼、呼吸或心跳引起的杂波。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110267287.0/2.html,转载请声明来源钻瓜专利网。