[发明专利]一种汉字信息处理方法及汉字拆分存储方法无效

专利信息
申请号: 201110244411.1 申请日: 2011-08-18
公开(公告)号: CN102262683A 公开(公告)日: 2011-11-30
发明(设计)人: 何瑞芳 申请(专利权)人: 何瑞芳
主分类号: G06F17/30 分类号: G06F17/30;G06F3/023
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 胡晶
地址: 加拿大不列颠哥伦比*** 国省代码: 加拿大;CA
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 汉字 信息处理 方法 拆分 存储
【权利要求书】:

1.一种汉字信息处理方法,其特征在于,包括:

预先对每一汉字进行囲字形单元的拆分,并把拆分结果存储至部件数据库,所述囲字形单元是由9个方位所组成,从左到右由上至下,这9个部位分别是左上、上、右上、左、中、右、左下、下、右下,所述每一汉字可拆分成囲字形单元中的两个或两个以上部位的部件;

在部件数据库中对应的字段存储汉字拼音信息,以及囲字形单元中每个部件的拼音信息,所述拼音信息包括拼音和/或拼音缩写和/或拼音声调信息;

可以通过部件组合,或汉字的拼音信息、部件的拼音信息,从部件数据库找到对应的汉字。

2.如权利要求1所述的汉字信息处理方法,其特征在于,预先对每一汉字进行囲字形单元的拆分进一步包括:

A1:对每个汉字进行囲字形单元的拆分,将拆开的部件及对应拼音信息保存至部件数据库;

A2:对囲字形单元中的每个部件进行囲字形单元的拆分,并把拆开后的部件及对应的拼音信息保存至部件数据库;

A3:判断组件构件能否再拆分,如能再进行步骤A2,如不能,则进行保存。

3.如权利要求2所述的汉字信息处理方法,其特征在于,利用囲字形单元,制定如下10条针对汉字的拆分规则:

(1)部件一定要是可以用UNICODE表达,并且可以由键盘输入,在计算机屏幕上可以独立地显示的笔画组合;

(2)部件的笔画少于原始汉字;

(3)部件是最大的笔画组合,每个汉字进行解构,拆分成数目最少的部件;

(4)个别笔画组合缺乏相对应的一模一样的部件,由形态与笔画类似的部件来代替;

(5)每一个传统的偏旁部首均是部件;

(6)直接相邻的方位,在方位的数据输入与检索中,具有相同的含义。部件尽量占据具有更多相邻位置的高等值位;

(7)在出现多种可能时,遵循传统的偏旁部首、部件汉字的出现频率,尽量做到自然而合理的拆分;

(8)如果汉字在纵向上的部件为4个,可选用的方位有上、中、下、右下。如果为5个,可选用的方位有左上、左、左下、下、右下;

(9)包孕结构,均呈现四面八方包围中部的特征,除了包围之外,还可以出现局部的重叠的现象。如果完全重叠,则归入全包围结构;

(10)部件可以继续拆分,直至最简单的横、竖、撇、捺、点笔画为止。

4.如权利要求1所述的汉字信息处理方法,其特征在于,编码按照如下这5条编码规则,来产生部件的线性拼音数据:

(1)左右结构的二合字,部件的拼音是左部件的拼音+右部件的拼音;

(2)上下结构的二合字:上部件的拼音+下部件的拼音;

(3)所有包孕结构与全包围结构的二合字:外围的部件的拼音+中部位的部件的拼音;

(4)左右结构的三合字和四合字,也即左上部位和左下部位有部件,或者左部位有部件而左上部位和左下部位无部件,依据从左到右,从上到下的顺序,则部件的拼音是:左上+左+左下+上+右上+中+右+下+右下部位的部件的拼音;

(5)其余汉字的部件组构的拼音,依据从上到下,从左到右的顺序,将各个部件的拼音拼合到一起:左上+上+右上+左+中+右+左下+下+右下部位的部件的拼音。

5.如权利要求1或4所述的汉字信息处理方法,其特征在于,部件的拼音是由以下规定产生的:

如果部件有拼音信息,则用它的拼音,否则,将该部件拆分,用拆分所得的部件的拼音信息。

6.按照权利要求5所述的汉字信息处理方法,其特征在于,所述拼音信息中包括声调,所述声调中缺少声调数据、第一声、第二声、第三声和第四声分别和0、1、2、3、4相对应,轻声和其它缺读音数据的汉字,都被赋予0值,所述编码包括汉字拼音+汉字声调+部件的拼音。

7.如权利要求1所述的汉字信息处理方法,其特征在于,编码为汉字拼音的双/单码+部件的双/单码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于何瑞芳,未经何瑞芳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110244411.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top