[发明专利]一种自动调节的咽腔电子喉语音通讯系统及方法在审
申请号: | 201610466117.8 | 申请日: | 2016-06-24 |
公开(公告)号: | CN107545888A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 徐天同 | 申请(专利权)人: | 常州诗雅智能科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/24;G10L15/14;G10L21/0208;H04N5/225;A61F2/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 213000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种可自动调节的咽腔电子喉语音合成与通讯系统与方法,基于计算机软件平台和外部硬件设备,包括摄像头、麦克风和电子喉振荡器,通过提取使用者面部和颈部运动图像的视觉语音特征信息,实现了对电子喉工作状态及咽腔嗓音源合成的自动控制,不仅使电子喉的使用无需手持,更加简单便捷,而且解决了合成嗓音源与电子喉施加部位不一致和电子喉语音机械不自然的问题,同时对咽腔电子喉重建语音进行动态去噪增强处理,提高了重建语音的质量与可懂度,并通过网络传输技术实现了电子喉语音的远程实时通讯,进一步拓展了电子喉的应用范围,改善了喉切除患者的生活质量。 | ||
搜索关键词: | 一种 自动 调节 电子 语音 通讯 系统 方法 | ||
【主权项】:
一种自动调节的咽腔电子喉语音通讯系统,包括麦克风、摄像头,电子喉振荡器(2),音视频采集模块与计算机软硬件系统,摄像头和麦克风(3)固定于麦克风支架上,耳机(1)下方设置有固定带,电子喉振荡器设置于固定带(5)上,其特征在于:该系统包括下述三个主要模块:1)发声过程中面部和颈部运动图像采集与处理模块,实现从运动图像的分析到视觉语音特征参数的提取;2)咽腔嗓音源动态合成模块,将提取的视觉语音特征参数转换为嗓音源合成模型参数,并按照咽腔嗓音源数学模型合成波形;3)咽腔电子喉重建语音实时增强与网络通讯模块,对采集的咽腔电子喉重建语音进行实时增强处理,并将处理后的语音进行远程网络传输,实现网络通讯功能;摄像头通过数据连接线将采集到的运动图像作为输入信号传输给运动图像处理模块进行视觉语音特征参数提取;运动图像处理后输出的视觉语音特征参数,又作为输入信号进入咽腔嗓音源合成模块控制波形的合成;合成的咽腔嗓音源波形再次通过数据线输出给电子喉振荡器,施加于颈部咽腔处;重建的咽腔电子喉语音经麦克风设备采集后,通过数据线输入语音增强模块,同时该模块也接收控制信号的输入;通讯模块的输入则包括摄像头采集的视频信号与增强后输出的语音信号两部分,最终经过网络输出到另一个客户端,同时另一个客户端发出的音视频信号也是在通讯模块接收并播放;由电子喉施加装置向计算机传输音视频信号进行处理,计算机提取的电子喉开关信号与合成的咽腔嗓音源信号传输给电子喉施加装置,电子喉施加装置工作所需的电能由计算机提供。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州诗雅智能科技有限公司,未经常州诗雅智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610466117.8/,转载请声明来源钻瓜专利网。
- 上一篇:语音指令处理方法及装置
- 下一篇:一种可任意变换角度的扫描仪