[发明专利]一种实时语音互译装置在审
申请号: | 201710048716.2 | 申请日: | 2017-01-20 |
公开(公告)号: | CN107315740A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 张明;关磊 | 申请(专利权)人: | 北京分音塔科技有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G10L21/10;G10L13/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 语音 装置 | ||
技术领域
本发明涉及信息通信技术领域,具体涉及一种实时语音互译装置。
背景技术
随着全球一体化进程的推进,国际经济贸易活动更加活跃,另外,跨 境旅游的人数也逐年增加,据官方统计,2015年中国出境旅游人数达1.17 亿人次,同比增长9.8%,同年,中国大陆接待入境旅游人数1.33亿人次, 且均呈现快速增长的态势。世界不同地区、不同种族的人们之间相互交流 也日益频繁,由于语言不通,通常需要翻译才能顺畅交流,或者借助电子 词典等随身设备进行沟通,但是,通过查词典来完成翻译,效率低、节奏 慢,导致沟通不顺畅,对于一些外语水平不高或外语口语不够熟练的人群 带来了困难和不便,因此,迫切需要一种便于随身携带的具有语音互译功 能的设备,来帮助解决不同语言的人员之间的沟通交流问题。
到目前为止,仍然缺乏一种有效的用户语音通信时现场完成实时语音 互译的解决方案,让用户通信中说出的语音让对方听到或收到的是自己选 定地语种声音,基于INTERNET的即时通信(IM),PSTN公共电话网,其它 无线移动电话网(GSM,CDMA,3G,SMS等通信方式)的多语种语音,文字的 即时互译系统,语音识别引擎,语音合成引擎,语音通道,翻译引擎,结 合了Internet、语音CODEC、视频CODEC、TCP/IP、数据库技术和软件技术 的Internet即时互译系统也有出现,但不能满足现场实时互译的需求。许 多企业和个人越来越多地认识到国际交流及个性化服务的重要性,语音识 别(ASR)技术,语音合成(TTS)技术也越来越成熟;即时互译,语音CODEC、 无线通信技术也发展到实用阶段;互译系统正是适应这种应用需求和技术 进步而提出的一种应用系统,但目前市场上仍然未出现相应的能够满足需 求的产品。
由于旅行到异国他乡,到了原移动通信运营商的服务范围之外,需要 接入当地运营商的无线通信网络,因此,还有要求这种提供实时互译功能 的产品能方便地接入当地运营商的网络。
设计一种能够自动识别语种的实时互译设备,将更为便于使用,给用 户以更好的体验。
发明内容
有鉴于此,本发明的一个目的是提供一种实时语音互译装置,可识别 当前说话者所说的语种
本发明提供的一种实时语音互译装置,包括:
生物特征识别模块,用于采集及识别说话者的生物特征,判定说话者 所说语种;
第一语音识别处理模块,对所述生物特征识别模块判定的甲语种进行 识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块,将所述甲语种文字翻译成乙语种文字,并转换成乙语 种语音信号,发送给播放单元进行播放;
第二语音识别处理模块,对所述生物特征识别模块判定的乙语种进行 识别,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块,将所述乙语种文字翻译成甲语种文字,并转换成甲语 种语音信号,发送给播放单元进行播放。
更适宜地,生物特征为指纹,生物特征识别模块为指纹识别器;所述 指纹识别器采集说话者的指纹并保存,当该说话者再次操作时,则判断采 用相应的语种进行处理。
更适宜地,生物特征为声纹,生物特征识别模块为声纹识别器;
声纹识别器采集说话者的声纹并保存,当该说话者再次说话时,采集 该说话者的声纹与所保存的声纹进行比对,则判断采用相应的语种进行处 理。
本发明还提供一种实现实时语音互译的装置,包括:
重力传感器模块,用于检测装置的倾斜角度,判定说话者及其所说语 种;
第一语音识别处理模块,对所述重力传感器模块判定的说话者及其所 说甲语种进行识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块,将所述甲语种文字翻译成乙语种文字,并转换成乙语 种语音信号,发送给播放单元进行播放;
第二语音识别处理模块,对所述重力传感器模块判定的说话者及其所 说乙语种进行识别,,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块,将所述乙语种文字翻译成甲语种文字,并转换成甲语 种语音信号,发送给播放单元进行播放。
当开始触发语音采集时,所述重力传感器模块检测装置的倾斜角度, 倾斜角度在第一预定范围内,则判断输入语种为甲语种;倾斜角度在第二 预定范围内,则判断输入语种为乙语种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京分音塔科技有限公司,未经北京分音塔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710048716.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:从储存设备的冲突检测
- 下一篇:一种河流与地下水耦合模拟参数的生成方法及装置