[发明专利]汉字的子汉字编码方法无效

专利信息
申请号: 96102611.1 申请日: 1996-01-23
公开(公告)号: CN1159622A 公开(公告)日: 1997-09-17
发明(设计)人: 邱励楠;邱行中 申请(专利权)人: 邱励楠
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 暂无信息 代理人: 暂无信息
地址: 518035 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 汉字 汉字编码 方法
【说明书】:

发明是关于汉字的一种编码方法。

目前汉字编码方法很多,已经在计算机上使用的汉字编码方法有几十种,其中包括最常见的拼音码、首尾码、五笔字型码、大众码和表形码等。这些编码都未能很好地同时解决汉字拆码的简易性、汉字输入的快速性和编码方法易记易学三方面的矛盾。例如拼音码,虽然简单易学,但重码率高,输入速度慢。首尾码、五笔字型码、大众码和表形码等虽然能实现汉字的快速输入,但汉字拆码难,部件或字根难以记忆。最近出现的自然码,是在双拼法的基础上发展起来的,它采用以词为主导、字词混合的编码方法,其汉字输入速度更高。但是这种编码仍存在汉字不易拆码、部件多、难以记忆等缺点。

本发明的编码方法在于不另外引入部件、字根等,而是通过选择汉字中的子汉字作为部件,对汉字拆分,并对汉字分类。这样使汉字的拆分变得十分简单,没有额外需要记忆的部件、字根等,因此彻底克服了许多编码方法中存在的汉字难以拆分和部件多、不容易记忆等缺点,并且重码率低,能够实现汉字的更高速度输入。

下面对本发明进行详细说明。

在本发明中,子汉字就是指一个汉字中所包含的汉字(“一”除外)。我们规定交式单体字不拆分,因此交式单体字不包含子汉字。

本发明对汉字的拆分原则是:

1.见汉字中有子汉字(首先取最大部分)就拆分,如果有需要,子汉字还可进一步拆分。如“暮”先拆分成“莫”和“日”,“莫”再拆分出“大”。“膏”先拆分成“高”和“月”,“高”再拆分出“口”。“汪”先拆分出“王”,“王”再拆分出“土”。

2.一个汉字最多拆分成三部分。如“懿”拆分成“壹”、“次”和“心”三部分。“嘉”拆分成“吉”、“加”和中间剩余部分。

3.汉字尽可能拆分成三部分。如“王”先拆分出“土”,“土”再拆分出“十”,因此,“王”拆分成“一”、“十”和“一”三部分。注意:“一”不是作为子汉字拆分出来的,而是从“王”拆分出“十”后剩余出来的。

4.汉字中的各部分尽可能多地参与编码。如“赣”拆分出“章”后,再从其右半部中拆分出“贡”。

5.按汉字笔画顺序进行拆分。如从“产”的前部分拆分出子汉字“立”,而不从后部分拆分出子汉字“厂”。

6.汉字尽可能多地拆分出子汉字。如“荔”拆分出最后面两个子汉字“力”,“能”拆分出最后面两个子汉字“匕”,“蠹”拆分出最后面两个子汉字“虫”,它们分别作为这些汉字的第二和第三部。如果从“蠹”的中间部分拆分出子汉字“石”,则其前面和后面部分均不能构成子汉字,按此拆分法,只能拆分出一个子汉字。“荔”和“能”的情况类似。

另外,如果汉字拆分成两个子汉字后,此两个子汉字均可再拆分出一个或均可再拆分出两个子汉字,我们规定拆分后面一个子汉字,前面一个子汉字不拆分。如坂、珠、歼、碘、秋、蜕、庐和窒等,从“窒”拆分出子汉字“穴”和“土”。又如辞、辜和踢等,“辜”拆分成“古”、“立”和“十”。

根据上述拆分原则,将汉字分为单部字、双部字和三部字。

1.单部字:具有下列特征的汉字都称为单部字。

(1)交式单体字,如东、乐、木、未、末、申、由、甲、电、中、串、央、丰、丸、臾、西、半、事、秉、禺、果和重等。

(2)无法拆分出子汉字的连式或散式单体字,如心、瓦、见、不、业、立、爪、瓜、予、永、衣、疋、雨、凸和凹等。

(3)无法拆分出子汉字的双体字或三体字等,如卵、兆、印、扎、非、宏、官、定、巡、匀和临等。

2.双部字:具有下列特征的汉字都称为双部字。

(1)只能拆分出一个子汉字或只能拆分成两个子汉字的连式或散式单体字等汉字,前者如土、父、太、犬、夭、方、户、白、石、禾、今、矛、朱、云、血、丕、尺,页、虫、布、氐、产、米、亚、兔和象等。后者如古、君、辛、兄、支、另、吊、名、易、星和岁等。

(2)双体字中至少有一体为子汉字、且此二体不能再分出子汉字,如:从、明、邓、订、江、过、伴、便、闭、闯、冰、畅、春、纯、饿、鹅、汞、鹤和氙等。

(3)双体字中至少有一体为子汉字,且在此二体或一体中,仅其中间部分为汉字,如渔、鲜和掺等。

(4)仅字首或字尾部分为子汉字的汉字,前者如足和走等,后者如受、帝、字、着、允、帚和学等。

(5)三体字或多体字中,拆分成两部分后,不能再拆分出子汉字,例如昂、蔽等。

3.三部字:具有下列特征的汉字都称为三部字。

(1)可拆分出子汉字、且该子汉字可再拆分出子汉字的连式或散式单体字。如:王、光、矢、百、卓、丢、壬、午、舌和缶等。

(2)可拆分出两个子汉字的连式或散式单体字,如桌和卒等。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邱励楠,未经邱励楠许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/96102611.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top