[发明专利]一种实时同步互译语音终端无效
申请号: | 200910040296.9 | 申请日: | 2009-06-17 |
公开(公告)号: | CN101923858A | 公开(公告)日: | 2010-12-22 |
发明(设计)人: | 劳英杰 | 申请(专利权)人: | 劳英杰 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F17/28;G10L13/08 |
代理公司: | 广州新诺专利商标事务所有限公司 44100 | 代理人: | 刘菁菁 |
地址: | 200030 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 同步 语音 终端 | ||
技术领域
本发明涉及一种任意自然语言间的语音及文字信息的实时互译系统及电子装置,特别涉及一种用于无线移动语音终端的工具及在线真人翻译服务。
背景技术
在世界的不同地域内,不同的社群及民族应用着不同的语言及文字。各地域的人群基于不同的活动目的:包括旅行、贸易及文化学习等而流动,需要相互学习彼此间不同的语言及文字。目前世界上被普遍应用的语言约有4至5千种之多。掌握着不同的语言或文字的人群在需要相互沟通的时候,客观上要求其中一方必须要认识对方的语言或文字,并以对方能认知的语言或文字进行意思表达。
计算机具备一定的计算能力,以计算机发展机器翻译是世界各地专家一直在开发及钻研的课题,因为计算机可以存储及转换大量的词汇数据,使不同语言或文字间的互译以自动方式实现。其运作形式是输入源文字词汇,转换为语义与之匹配的另一种文字的词汇。无论哪一种语言或文字都有其自身语法固有的特性,任何两种语言或文字之间都不存在句子的语法结构完全相同、词义一一对应的直接转换情况。而且无论哪一种语言或文字系统内都存在同音词及一词多义等情况,其区分更为微妙。过往翻译质量的低劣,究其原因关键在于不能正确地认知源语言文字的语义。
世界上的文字,大概有两种大类型,一种是象形文字,如汉字,另一种是源自印欧语系的各种拼音文字。拼音文字语种比较接近,所以在互译时容易得到较好的翻译质量;象形文字的汉语,文字结构的分歧比较大,拼音文字与汉语互译时在语法上出现的分歧更大,难以按顺序进行词汇的一一对应,因此很难得到较好的翻译质量。
过往的机器翻译,大多都使用诺姆乔姆斯基(Noam Chomsky)的深层结构方式,任何语言及/或文字需先与深层结构语言建立映射对应关系,此结构语言是以非固定长度的英语文字为基础,各种语言通过该映射对应关系实现互译功能。目前以计算机实现翻译系统的技术,主要是语音通过语音接收器进行认知,转换为文字信息并以现时的文字编码方式储存及传输。现时的文字编码方式是指以8位元组成1字节的ASCII、Big-5、GB18030或Unicode等。本发明的3位元集编码形式语义数字数据,其本质仍然是文字编码。
最早期的机器翻译主要是文字翻译文字,目前通过电子翻译系统得到的质量并不理想,准确率大概只能达到约65-75%。以机器实现两种自然语言的语音对译就更难,因为语音需要通过将语音转换为文字(Speech-to-Text)、文字信息再转译为另一种语言的文字信息、然后再将后一种语言的文字信息转换为语音(Text-to-Speech),该文字信息转换成语音的过程要求必须具备所属语言的语法逻辑,才能成功转换合成为自然语言语音;完成上述过程才能达到两种语言的沟通对译过程。
目前语音转换文字技术准确率不高,最大原因是由于对同音及近音词汇的错误判断。机器无法对同音及近音词汇进行正确判断。现时市场上应用的IBM ViaVoice语音转换文字产品,准确率亦只能达到约65-75%,以此准确率将得到的文字信息再翻译为另一种文字,出错率更高,所得到的语义往往无法理解,没法达到沟通的目的。过往自然语言的语音认知技术,都需要多种层次的语音档进行匹配,包括以词组、片语、短句等混合层次的配合才能得到认知结果,但大量多层次的语音档极耗硬件及运算资源;多语言互译所占用的资源更是以倍数增加。
随身的翻译通信电子终端有翻译手帐及翻译笔等,翻译手帐是以键盘输入源文字信息进行翻译,但常遭遇到输入者不懂得如何输入个别的字或词,导致无法通过翻译手帐来得到译文。翻译笔是以笔尖的扫描器输入文字图象,图象被识别後转换为文字信息,文字再进行互译,但只局限于词组间的互译;而且输入、识别及转换的过程耗时,只适合小量短句的翻译。可以推想,最方便快捷的互译方式是以任一种自然语言的语音输入,然後转译为另一种自然语言的语音及/或文字输出。
不同语种间的互译需求是巨大的。在生活上不同语种的人会面对面相遇,或以电话进行语音沟通;若双方互不懂对方的语言,那就不可能以任何语言进行沟通。移动电话的应用在现代生活中占着重要的一席之位,移动电话目前的应用数量已达到30多亿,是世界人口的一半数量。以30多亿的移动电话渗透率考量,移动电话能够充当最理想的随身语音翻译系统。人类长时间沟通的目的是信息交换,信息交换的本质其实是语义交换,任何自然语言或文字信息间的互译的本质是通过语义的匹配建立起对应映射过程,这样才能得到准确的翻译质量。最理想是每种自然语言以最小容量及活动性的模组化方式安装于电子系统内,多个语言翻译程式模组亦不致产生太大负担。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于劳英杰,未经劳英杰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910040296.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电池监控装置及其方法
- 下一篇:热固性聚酰亚胺树脂及其制备方法