[发明专利]中文电脑的汉语语音输入系统及其方法无效
| 申请号: | 94102358.3 | 申请日: | 1994-03-03 |
| 公开(公告)号: | CN1063554C | 公开(公告)日: | 2001-03-21 |
| 发明(设计)人: | 李琳山 | 申请(专利权)人: | 李琳山 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 程天正,王忠忠 |
| 地址: | 中国*** | 国省代码: | 台湾;71 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 中文 电脑 汉语 语音 输入 系统 及其 方法 | ||
本发明是关于一种智慧型汉语语音输入方法及汉语听写机。本发明是同一发明人的台湾专利申请案第78105818号的改良,利用此改良方法,或使得利用汉语语音输入中文文字的方法更为精确。
目前中文电脑的输入方法百家争鸣,或用注音,或用字根,或用划笔,但没有一种是众所公认最好的(因为没有一种真正最方便)。这是因为有的输入速度较慢,有的需要特别训练,有的方法特别要背口诀,久了不用会忘掉等,而人人都会、不需训练的注音符号法,则因其速度太慢,而无法通行。在众多中文输入法中,速度最快的是仓颉法、大易法或类似的方法,但此方法却只有专业人员在长期训练下才会用,一般人不常用就会忘掉。事实上,这是现阶段我国社会信息化最大的障碍,因为“中文输入”变成一种专门职业,一般人自然不会常用它。这些方法不方便的基本原因,是尝试把汉字转成几个按键,由键盘输入;但事实上键盘是西方拚音文字下的产物,汉字不是拚音文字,所以由键盘输入就自然不方便了。
既然键盘输入不方便,还有什么其他方法可用呢?很多人很早就想到了可用声音输入。只是用声音输入的技术困难太多,几乎是不太可能的事,所以一直没有这方面的方便产品问世。技术上困难的原因有三点:(1)需要辨识的词汇太多了,中文常用字至少五千个,常用词至少十万个,这种数字已超出技术可行的范围;(2)中文字的同音字太多,即使知道是什么音,又如何能方便而快速无误地知道是什么字呢?(3)要能“即时”听写汉语,就必须在极短时间内解决如此困难的问题,更是不容易。
本发明人的美国专利第5,220,639号专利申请案基本上已可以解决上述困难,这是因为:(1)选用汉语单音节为单位:中文字、词的数日虽大,不同的单音节却只有1300个,是语音辨认技术上可以接受的范围;知道是什么音节以后,可以再由其前后的音节去判断可能构成什么词、什么句。(2)藉助以中文字为基础的马可夫模型建立中文的语言模型,可以靠大量的训练文字,统计出每一个字的前后与其他不同的字衔接的机率,由这些机率可以算出当一个音节前后与其他音节衔接时,这些音节最可能是代表什么字,这种方法可以大部分解决同音字的问题,不能解决的再在荧光屏上予以更正。(3)制作特殊设计的硬件,以便在最短时间内完成复杂的工作。
然而,前项申请案的发明基本上虽已可决上述困难,但有其先天上的限制:(1)所需运算量极大,为了要达到“即时”听写汉语的目的,亦即在很短时间内完成极大量运算,必须制作特殊设计的硬件,使得该发明代价昂贵,(2)正确率仍不够高(约89%),使用者仍需一再更正错字。这两项限制是至今它并没有成为产品大量上市的原因。
本发明中,就是考虑到前项专利案的上述限制,便在原有的构想下发展出两项重要的新技术:(1)专门针对汉语单音节的特性,发展出专门作汉语单音节辨识的“段落统计模型”及(2)专门针对中文的语言结构,发展出“词类双连中文语言模型”。这两项技术都是针对中文及汉语的特性发展出来,结合起来以后,所需的运算量大为减小,而正确率却可大为提高。于是不再需要特殊硬件来达到“即时”输入,同时,所有技术可以用软件完成,并轻易写入任何装有一片“数字信号处理芯片”(DSP Chip)的“数字信号处理电路板(DSPBoard)”(这类芯片及电路板市面上产品很多,故很容易在不同的电路板或芯片上发展出不同的产品),只要芯片的运算速度足够快,电路板上的存储容量足够大,它就能“即时”输入。这块电路板可以插入任何一台AT级以上的个人电脑上,故使用方便,价格亦可大为降低。以上述的基本技术及功能为基础,本发明又进一步发展出诸如“智慧型学习技术”,使得这套听写机更具备不时“学习”的“智慧”。这包括:自动学习新使用者的声音,从而使得新使用者可以很快开始使用;自动学习使用者的环境噪音并适应该噪音;不断联机学习使用者的声音、用字、用词、构句等,使得正确率可以继续上升等等。所有这些都将在以下详细说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李琳山,未经李琳山许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94102358.3/2.html,转载请声明来源钻瓜专利网。





