[发明专利]以无模式输入将一种文本形式转换成另一种文本形式的语言输入体系结构无效
申请号: | 00814906.2 | 申请日: | 2000-10-13 |
公开(公告)号: | CN1384940A | 公开(公告)日: | 2002-12-11 |
发明(设计)人: | 李凯夫;陈征;韩建 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 吴丽丽 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式 输入 一种 文本 形式 转换 另一种 语言 体系结构 | ||
技术领域
本发明涉及语言输入方法和系统。更具体地说,本发明提供语言输入方法和系统,它对文本录入过程中发生的打字错误和在从一种语言形式到另一种语言形式的转换过程中发生的转换错误都有容错能力(errortolerance)。
背景技术
语言专用文字处理软件已存在多年。更复杂的文字处理器为用户提供了先进的工具,如拼写和语法校正,以协助起草文件。例如,许多文字处理机器能识别拼措的词或语法上不正确的句子结构,而且在一些情况下自动改正识别出的错误。
一般地说,有两种原因使错误被引入到文本中。一个原因是使用者根本不知道正确的拼写或句子结构。文字处理器能提出建议以协助使用者选择正确的拼写或措辞。第二个和更典型的错误原因是使用者不正确地向计算机中送入了词或句子,即使他/她知道正确的拼写或语法结构。在这种场合,在识别不适当送入的字符串和把它们改正为预想的词或短语方面,文字处理器往往相当有用。
在为不采用罗马字符的语言所设计的文字处理器中,录入(entry)错误往往更为普遍。对于许多种语言,不存在语言专用键盘,如英文版QWERTY键盘,因为这些语言拥有的字符比能够方便地作为键安排在键盘中的字符多得多。例如,许多亚洲语言含有数千个字符。在实际上不可能造出一个键盘来支持用于这许多不同字符的单独键。
不是去设计昂贵的语言和方言专用键盘,而是使语言专用文字处理系统允许使用者从一个小字符集键盘(例如QWERTY键盘)输入语音文本并把那个语言文本转换成语言文本。“语音文本”代表说一种给定语言时造成的声音,而“语言文本”代表它们实际出现在文本中时的书写字符。例如,在中文中,“拼音”是语音文本的一个例子,而“汉字”是语言文本的一个例子。通过把语音文本转换成语言文本,许多不同的语言能由语言专用文字处理器使用传统的计算机和标准的QWERTY键盘来处理。
这样,需要语音输入的文字处理器经受两类可能的输入错误。一类输入错误是通常的打字错误。然而,即使该文本没有打字错误,另一类错误是文字处理引擎可能不正确地把语言文本转换成非预想的字符文本。当在同一个语音文本输入串中这两个问题都起作用时,便可能造成一连串错误。在某些场合,如果不对该短语或句子的整个上下文进行长长的研究便不可能容易地发现由打字引发的错误。
这里所描述的发明主要是针对键入语言文本时由使用者造成的前一类输入错误,但也提供了对文字处理引擎造成的转换错误的容错。为了更好地演示伴随这种打字错误出现的问题,考虑一种基于中文的文字处理器,它把语音文本“拼音”转换成语言文本“汉字”。
有若干个理由说明为什么输入语音文本往往打字错误增多。一个理由是在英文键盘上的平均打字准确率在中国要比在英语国家低。第二个理由是语音文本使用得并不那么频繁。在早年的教育中,使用者并不象说英语的使用者受教于拼写英文词那样倾向于研究和学习语音拼写。
在语音文本输入过程中打字错误增多的第三个理由是许多人天生地以地方方言说话,这与标准方言相反。作为语音文本来源的标准方言是第二语言。在某些方言和口音中,说出的词可能不与相应的适当语音文本匹配,这样使得一个使用者更难于键入语音文本,例如,许多中国人说各种中国方言作为他们的第一语言并且被教授“普通话”中文作为第二语言,而“普通话”是“拼音”的来源。例如,在一些中国方言中,在某些上下文中“h”和“w”的发音没有区别;而在其他方言中,“ng”和“n”能被说成一样的;又在其他方言中,“r”不能被清晰地发出。结果,把说“普通话”作为第二语言的中文使用者当试图输入拼音时可能易于发生打字错误。
打字错误多的另一个可能原因是当输入语音文本时难于核查错误。这部分地由于语音文本通常是长的、不可读的字符串,它们是难读的。与看到的内容就是输入的内容的基于英文的文本输入相比,输入的语音文本往往不是“所见即所得”,而是由文字处理器把语音文本转换成语言文本。结果,使用者通常不去检验语音文本中的错误,而是宁肯等待直到语音文本被转换成语言文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/00814906.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:断路器的插入/抽出装置
- 下一篇:棉铃虫颗粒体病毒增效蛋白应用