[发明专利]一种汉字信息处理方法及汉字拆分存储方法无效
申请号: | 201110244411.1 | 申请日: | 2011-08-18 |
公开(公告)号: | CN102262683A | 公开(公告)日: | 2011-11-30 |
发明(设计)人: | 何瑞芳 | 申请(专利权)人: | 何瑞芳 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/023 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 加拿大不列颠哥伦比*** | 国省代码: | 加拿大;CA |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汉字 信息处理 方法 拆分 存储 | ||
1.一种汉字信息处理方法,其特征在于,包括:
预先对每一汉字进行囲字形单元的拆分,并把拆分结果存储至部件数据库,所述囲字形单元是由9个方位所组成,从左到右由上至下,这9个部位分别是左上、上、右上、左、中、右、左下、下、右下,所述每一汉字可拆分成囲字形单元中的两个或两个以上部位的部件;
在部件数据库中对应的字段存储汉字拼音信息,以及囲字形单元中每个部件的拼音信息,所述拼音信息包括拼音和/或拼音缩写和/或拼音声调信息;
可以通过部件组合,或汉字的拼音信息、部件的拼音信息,从部件数据库找到对应的汉字。
2.如权利要求1所述的汉字信息处理方法,其特征在于,预先对每一汉字进行囲字形单元的拆分进一步包括:
A1:对每个汉字进行囲字形单元的拆分,将拆开的部件及对应拼音信息保存至部件数据库;
A2:对囲字形单元中的每个部件进行囲字形单元的拆分,并把拆开后的部件及对应的拼音信息保存至部件数据库;
A3:判断组件构件能否再拆分,如能再进行步骤A2,如不能,则进行保存。
3.如权利要求2所述的汉字信息处理方法,其特征在于,利用囲字形单元,制定如下10条针对汉字的拆分规则:
(1)部件一定要是可以用UNICODE表达,并且可以由键盘输入,在计算机屏幕上可以独立地显示的笔画组合;
(2)部件的笔画少于原始汉字;
(3)部件是最大的笔画组合,每个汉字进行解构,拆分成数目最少的部件;
(4)个别笔画组合缺乏相对应的一模一样的部件,由形态与笔画类似的部件来代替;
(5)每一个传统的偏旁部首均是部件;
(6)直接相邻的方位,在方位的数据输入与检索中,具有相同的含义。部件尽量占据具有更多相邻位置的高等值位;
(7)在出现多种可能时,遵循传统的偏旁部首、部件汉字的出现频率,尽量做到自然而合理的拆分;
(8)如果汉字在纵向上的部件为4个,可选用的方位有上、中、下、右下。如果为5个,可选用的方位有左上、左、左下、下、右下;
(9)包孕结构,均呈现四面八方包围中部的特征,除了包围之外,还可以出现局部的重叠的现象。如果完全重叠,则归入全包围结构;
(10)部件可以继续拆分,直至最简单的横、竖、撇、捺、点笔画为止。
4.如权利要求1所述的汉字信息处理方法,其特征在于,编码按照如下这5条编码规则,来产生部件的线性拼音数据:
(1)左右结构的二合字,部件的拼音是左部件的拼音+右部件的拼音;
(2)上下结构的二合字:上部件的拼音+下部件的拼音;
(3)所有包孕结构与全包围结构的二合字:外围的部件的拼音+中部位的部件的拼音;
(4)左右结构的三合字和四合字,也即左上部位和左下部位有部件,或者左部位有部件而左上部位和左下部位无部件,依据从左到右,从上到下的顺序,则部件的拼音是:左上+左+左下+上+右上+中+右+下+右下部位的部件的拼音;
(5)其余汉字的部件组构的拼音,依据从上到下,从左到右的顺序,将各个部件的拼音拼合到一起:左上+上+右上+左+中+右+左下+下+右下部位的部件的拼音。
5.如权利要求1或4所述的汉字信息处理方法,其特征在于,部件的拼音是由以下规定产生的:
如果部件有拼音信息,则用它的拼音,否则,将该部件拆分,用拆分所得的部件的拼音信息。
6.按照权利要求5所述的汉字信息处理方法,其特征在于,所述拼音信息中包括声调,所述声调中缺少声调数据、第一声、第二声、第三声和第四声分别和0、1、2、3、4相对应,轻声和其它缺读音数据的汉字,都被赋予0值,所述编码包括汉字拼音+汉字声调+部件的拼音。
7.如权利要求1所述的汉字信息处理方法,其特征在于,编码为汉字拼音的双/单码+部件的双/单码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于何瑞芳,未经何瑞芳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110244411.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:线性振动器
- 下一篇:多功能内镜下微创剥离刀