[其他]按单音节划分中文词的方法与装置在审
| 申请号: | 101986000000118 | 申请日: | 1986-01-10 |
| 公开(公告)号: | CN1003193B | 公开(公告)日: | 1989-02-01 |
| 发明(设计)人: | 乔基姆·海因策尔 | 申请(专利权)人: | 西门子公司 |
| 主分类号: | 分类号: | ||
| 代理公司: | 中国专利代理有限公司 | 代理人: | 匡少波 |
| 地址: | 联邦德国.慕*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音节 划分 文词 方法 装置 | ||
借助于拉丁字母作拼音字母组成的词实现输入中文字符。中文词是由音节组成的,这些音节中的每个再重新转化成中文字符。词即为一个或多个字符组成的字列,由此也是一个或多个音节组成的排列。在利用拼音字母组成词输入时将这个字母列与存储在存储器(SP)中音节相比较并自动地按音节特其划分,在这里如果其字母既可以编入正在观察的一个音节中,又可以编入下一个音节中时总是将它们编入正在观察的这个音节中。为了继续地进行处理,对音节配置了音节识别号并且每个词编译成一个由音节识别号组成的单义数列。
本发明涉及到在一个终端装置上输入中文字符的方法,在该终端装置上利用拉丁字母作为一种拼音字符输入由中文字符组成的中文词。此外还涉及到用于实施这种方法的一种设备。
众所周知的是:借助于用可打字的拼音符号组成的词利用键盘输入中文字符。利用这种拼音符号即可按拉丁字母的排列输入一种与发音符号相似的音节。中文词由音节组成,每一个音节是由一个首音及一个尾音组成的。由此形成了大约410个不同的音节,它们中每一个由可能出现的25种首音中的一个及34种尾音中的一个组成的。每个音节利用与该音节对应存储的多个字符(同音字符)中的一个字符翻译成中文字。因此词即为一个或几个字符组成的字列或是由一个或多个音节组成的音节的排列。
可以想象,用键盘输入这些中文字符,这种键盘分作
如果中文字符借助于具有拉丁字母的国际通用键盘使用能打字的拼音符号进行输入的话,则以单个音节进行词的简单划分是不能直接地作到的,因为首音是由零至二个字母组成的,尾音是由一至四个字母组成的。
本发明是以下述任务为基础的:即确定出一种方法与设备,借助于它们就可以使应用能以键盘打入的
这个涉及上述技术方法的发明任务根据本发明以下列方式来实现:即当使用了
按照本发明的方法具有这样的优点:对现有的国际通用键盘不用作任何改动即可用来输入中文字符,并且这种输入方式需要的服务费用低。
为了避免以音节划分词所产生的多义性,在每个可能出现多义性的位置上引入分割符号可以解决此问题。例如,这些分割符号是符号“′”或符号“-”。为了进行继续的文字处理,对每一个音节分配一个音节识别号,并且将词编译成一个单义的识别号数列。
这些音节识别号按照本发明的方法是相对按字母顺序排列形成的音节进行编号的。
用于实施上述方法的有效设备具有下列特征:在其中设置了存储所有的通用音节的存储器;以及一个控制单元,它在每输入了一个字母后,即将其与存储器中存储的音节进行比较,以校验这些字母是否能单义地作为单音节加以识别,否则总是继续观察随后的字母,其目的是为了按音节划分词。
为了实现本发明,控制单元具有这样的功能:即当输入了一个分割符号以后,该控制单元即将刚输入的最后一个音节与后面的字母分隔开来。
为了进一步地进行处理,针对音节在存储器中分配了音节识别标志,并且当确定了单义存在的单音节时控制单元从存储器中读出所属的音节识别标志。
在存储器中存储的音节识别号是与按字母顺序排列出现的音节相对应的。
以下将根据附图详细地解释本发明的方法及实施该方法的设备。其附图为:
图1:实施本发明方法用的设备框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/101986000000118/2.html,转载请声明来源钻瓜专利网。
- 上一篇:冲击电流限制电路
- 下一篇:汉字输入终端的方法与装置
- 同类专利
- 专利分类





