[发明专利]中文电脑的汉语语音输入系统及其方法无效

专利信息
申请号: 94102358.3 申请日: 1994-03-03
公开(公告)号: CN1063554C 公开(公告)日: 2001-03-21
发明(设计)人: 李琳山 申请(专利权)人: 李琳山
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 中国专利代理(香港)有限公司 代理人: 程天正,王忠忠
地址: 中国*** 国省代码: 台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 中文 电脑 汉语 语音 输入 系统 及其 方法
【说明书】:

本发明是关于一种智慧型汉语语音输入方法及汉语听写机。本发明是同一发明人的台湾专利申请案第78105818号的改良,利用此改良方法,或使得利用汉语语音输入中文文字的方法更为精确。

目前中文电脑的输入方法百家争鸣,或用注音,或用字根,或用划笔,但没有一种是众所公认最好的(因为没有一种真正最方便)。这是因为有的输入速度较慢,有的需要特别训练,有的方法特别要背口诀,久了不用会忘掉等,而人人都会、不需训练的注音符号法,则因其速度太慢,而无法通行。在众多中文输入法中,速度最快的是仓颉法、大易法或类似的方法,但此方法却只有专业人员在长期训练下才会用,一般人不常用就会忘掉。事实上,这是现阶段我国社会信息化最大的障碍,因为“中文输入”变成一种专门职业,一般人自然不会常用它。这些方法不方便的基本原因,是尝试把汉字转成几个按键,由键盘输入;但事实上键盘是西方拚音文字下的产物,汉字不是拚音文字,所以由键盘输入就自然不方便了。

既然键盘输入不方便,还有什么其他方法可用呢?很多人很早就想到了可用声音输入。只是用声音输入的技术困难太多,几乎是不太可能的事,所以一直没有这方面的方便产品问世。技术上困难的原因有三点:(1)需要辨识的词汇太多了,中文常用字至少五千个,常用词至少十万个,这种数字已超出技术可行的范围;(2)中文字的同音字太多,即使知道是什么音,又如何能方便而快速无误地知道是什么字呢?(3)要能“即时”听写汉语,就必须在极短时间内解决如此困难的问题,更是不容易。

本发明人的美国专利第5,220,639号专利申请案基本上已可以解决上述困难,这是因为:(1)选用汉语单音节为单位:中文字、词的数日虽大,不同的单音节却只有1300个,是语音辨认技术上可以接受的范围;知道是什么音节以后,可以再由其前后的音节去判断可能构成什么词、什么句。(2)藉助以中文字为基础的马可夫模型建立中文的语言模型,可以靠大量的训练文字,统计出每一个字的前后与其他不同的字衔接的机率,由这些机率可以算出当一个音节前后与其他音节衔接时,这些音节最可能是代表什么字,这种方法可以大部分解决同音字的问题,不能解决的再在荧光屏上予以更正。(3)制作特殊设计的硬件,以便在最短时间内完成复杂的工作。

然而,前项申请案的发明基本上虽已可决上述困难,但有其先天上的限制:(1)所需运算量极大,为了要达到“即时”听写汉语的目的,亦即在很短时间内完成极大量运算,必须制作特殊设计的硬件,使得该发明代价昂贵,(2)正确率仍不够高(约89%),使用者仍需一再更正错字。这两项限制是至今它并没有成为产品大量上市的原因。

本发明中,就是考虑到前项专利案的上述限制,便在原有的构想下发展出两项重要的新技术:(1)专门针对汉语单音节的特性,发展出专门作汉语单音节辨识的“段落统计模型”及(2)专门针对中文的语言结构,发展出“词类双连中文语言模型”。这两项技术都是针对中文及汉语的特性发展出来,结合起来以后,所需的运算量大为减小,而正确率却可大为提高。于是不再需要特殊硬件来达到“即时”输入,同时,所有技术可以用软件完成,并轻易写入任何装有一片“数字信号处理芯片”(DSP Chip)的“数字信号处理电路板(DSPBoard)”(这类芯片及电路板市面上产品很多,故很容易在不同的电路板或芯片上发展出不同的产品),只要芯片的运算速度足够快,电路板上的存储容量足够大,它就能“即时”输入。这块电路板可以插入任何一台AT级以上的个人电脑上,故使用方便,价格亦可大为降低。以上述的基本技术及功能为基础,本发明又进一步发展出诸如“智慧型学习技术”,使得这套听写机更具备不时“学习”的“智慧”。这包括:自动学习新使用者的声音,从而使得新使用者可以很快开始使用;自动学习使用者的环境噪音并适应该噪音;不断联机学习使用者的声音、用字、用词、构句等,使得正确率可以继续上升等等。所有这些都将在以下详细说明。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李琳山,未经李琳山许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/94102358.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top