[发明专利]语音输入方法及装置无效
| 申请号: | 201010187345.4 | 申请日: | 2010-07-26 |
| 公开(公告)号: | CN101876887A | 公开(公告)日: | 2010-11-03 |
| 发明(设计)人: | 刘彤 | 申请(专利权)人: | 刘彤 |
| 主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L15/26 |
| 代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 朱小杰 |
| 地址: | 瑞典斯德哥尔*** | 国省代码: | 瑞典;SE |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 输入 方法 装置 | ||
技术领域
本发明涉及一种计算机语音输入技术,特别的涉及将说话语音转变为相应文字的语音输入方法及装置。
背景技术
计算机的出现给人们书写文字和写作提供了巨大的方便,它使得任何稍微懂得计算机的人都可以方便地写任何文件、书信。迄今为止,用计算机书写文字的最好和使用最为普遍的方法是用键盘。但是这方法有两个缺点,一是速度慢,尤其是用户键盘输入中文,因为键盘本质上是为输入西方文字而设计的;二是要求使用者有必要的键盘输入的训练和技巧,尤其是具有较高输入速度要求的时候。
由于用键盘输入文字速度慢,而人们说话的速度远远快于键盘输入的速度,所以它不适于做会议、谈话的记录。而对于没有经过专门训练的人,用键盘来快速输入篇幅比较长的中文,是一项非常困难的工作。
美国的IBM公司在过去一些年做了不少语音识别和语音合成的研究工作,在此基础上开发出了名为“VIAVOICE”的语音识别技术和产品。它是个开发成熟而使用较广的技术,目前已应用在许多公司的手机和其它电子产品上,用于接收用户发出的语音指令。但是该技术识别短语和单词的量有限,识别的正确率约在50-70%之间。由于错误比例太大,使用起来很不方便,所以除了用在手机指令系统,其他使用场合很少见到。此外其他几个公司也做过类似语音输入的尝试,结果并不比IBM技术更好,因此其技术基本不为市场所接受,产品也无人问津。
VIAVOICE和其他现存语音识别与输入技术内容总的来说,都是用查字典(数据库)的方式完成的。即对一种语言,建立一个词汇发音与对应词汇文字的尽可能完全的数据库。用户说出的话被话筒收入后,输入计算机转为数值音频信号。对于相应于音频信号中每个字词的音素,其技术通过查找数据库把相应的词寻找出来,由此把语音输入转换为文字。其工作过程由图1所示。
然而由于对应一个音素,往往有多个字或者词,而仅凭查数据库无法确定应该取哪一个,所以上述产品都默认采取数据库中的第一个字或词。这样难免发生较高的错误率,见图1,在“中国,古老而美丽的国家“这样一句话语音输入中,出现了两处错误。
VIAVOICE和其他现存语音识别与输入技术的另外一个出错的来源是噪音的干扰。当人说出的话语通过话筒输入电脑而转化为数值音素时,由于话筒质量问题、音频采集过程和数模转化,不可避免地都会产生噪音,这些噪音叠加在语音信号上,在输入音素中占相当大的比例,从而导致伪语音输入信号,必然导致语音识别容易出现错误。
中国国家知识产权局公开的申请号为01144523.8发明专利申请公开说明书公开了一种语音输入方法及装置,其主要功能面向手提数字电子设备的语言指令系统,语言都较为简短,但是该技术与VIAVOICE一样,存在上文所述的不足。
发明内容
本发明的首要目的在于提供一种能够降低语音识别错误率、并且具有智能识别功能的语音输入方法,其次在于提供一种能够实现语音输入高识别率、智能识别输入的装置。
实现本发明目的的技术方案是:
一种语音输入方法,具有如下步骤:
1)由语音收集器收入用户发出的语音;
2)把收集到语音中的噪音过滤掉;
3)根据语音-字词数据库辨认出相应文字;
4)根据输入的上下文对输入的文字进行更正,以获得正确的文字;
5)将得到的全部输入文字显示出来或者输入文件。
上述步骤2)包括如下步骤:
a、将语音收集器中的语音电流信号转换成数字音频信号;
b、将数字音频信号进行Z变换,过滤掉说话频率之外的频率;
c、将剩余的音频信号进行Z变换的逆变换,得到过滤后的语音信号。
上述步骤3)中语音-字词数据库包括吴语字数据库、广东话音字数据库、四川话音字数据库、普通话音字数据库、英国英语数据库和美国英语数据库。
上述步骤3)和4)中由智能语音识别器进行判断识别,判断时由智能语音识别器的智能语言识别核心读入字词数据库、语法数据库、惯用法数据库和文章领域、风格与内容数据库,以选择最合适的字词。
上述文章领域、风格和内容信息数据库随着识别语音内容的不断增多而不断将输入内容信息补充到自身数据库中。
一种语音输入装置,包括语音收集器、数模转换音卡、Z变换集成电路模块、智能语音识别器、存储器和显示模块,上述语音收集器与数模转换音卡连接,数模转换音卡与Z变换集成电路模块连接,Z变换集成电路模块与存储器连接,智能语音识别器与存储器连接,显示模块与存储器连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘彤,未经刘彤许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010187345.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在虚拟平台上实现虚拟机移转的方法
- 下一篇:模具复制加工的方法





