1.一种汉字电脑键盘输入法编码方案及其键盘使用规范,它包括:①一种把单字按其部件书写的先后顺序,拆分成相应字根组合的工艺规范(以下简称“拆字规范”)、②一套汉字字根形态特征和编码特征的规范(以下简称“字根规范”)、③一种把字根符号转换成电脑键盘符号的编码规范(以下简称“字根编码规范”)、④一种把汉字单字转换成电脑键盘符号的规范(以下简称“单字编码规范”)、⑤一种把汉字词组转换成键盘输入符号的规范(以下简称“词组编码规范”)、⑥一种把特殊文字符号转换成键盘输入符号的规范(以下简称“特殊符号编码规范”)、⑦6763个国标一二级汉字的键盘输入符号的一一对应编码方案(以下简称“单字编码方案”);其特征在于:1)在前述①的“拆字规范”中,对单字的拆分实行“先粗分,后细分、粗细互补、前后呼应”的“二级解剖拆字工艺”:首先对单字进行一次直观的拆解,假如拆出的子字根数不足4个,则对第一次拆解得出的子字根进行再次分解,取第一个子字根的第一个孙字根作为补充根,假如加上补充字根后的所得字根数仍不足4个,则取第二个子字根的第一个孙字根作为补充根,即可补足4个字根;例如:“克”=“古”+“儿”,第一次拆解所得的字根不足4个(只有2个),则加上“古”的第一个字根“十”,但仍不够4个,则再加上“儿”的第一个字根“丿”,由此得出“克”=“古”+“儿”+“十”+“丿”4个字根;2)在前述①的“拆字规范”中,对单字的拆分制定的实施规范为:(1)述语约定:A=对单字进行直接拆分得出的第一个
子字根;B=对单字进行直接拆分得出的第二个
子字根;C=对单字进行直接拆分得出的第三个
子字根;D=对单字进行直接拆分得出的超过第三个的最后一个
子字根;Aa=对
子字根A进行拆分得出的第一个
孙字根;Ba=对
子字根B进行拆分得出的第一个
孙字根;(2)中文字的三种类型及其拆分规范:a)单笔画型:由“点横竖撇折”(丶一丨丿乙)五种笔画中的某一种单笔字根组成的单字,不能拆分为更细体的字根,就是用该单笔重复四次表示(拆为A+A+A+A),如“一”(全码是“////”)、“乙”(全码是“vvvv”);b)二元型:可拆分出二个子字根A和B,不足四个子字根,用孙字根Aa和Ba补够四个,拆为(A+B+Aa+Ba);c)三元型:可拆分出三个子字根A、B、C,不足四个子字根,用孙字根Aa补够四个,拆为(A+B+C+Aa);d)四元型:可拆分出四个(或者多于四个)子字根A、B、C、D,拆为(A+B+C+D);3)在前述①的“拆字规范”中,在单字拆分过程中的局部字根取舍上遵循三项原则:(1)取高舍低:活字码规定,笔画数多的字根的级别高于笔画数少的字根;为了体现
拆字的直观性,在多种可选字根中,优先选取其中级别最高的字根;因此,有大字不取小字,有小字不取偏旁,有大偏旁不取小偏旁,有小偏旁不取单笔画;超过四个组件的字,最后一个字根有大取大,尽可能取更多的笔画结构而尽可能不取较少的笔画的字根或单笔画的字,例如:“鹿、广、
![]()
![]()
米”都是活字码承认的字根,“麋”字应拆为“鹿+米”而非“广+
![]()
+
![]()
+米”;“木”和“林”都是活字码承认的字根,“梵”字应拆为“林凡”而非“木木凡”;“丅”和“丨”都是活字码承认的字根,“隔”应字拆为“阝一口丅”而非“阝一口丨”,因为“丅”的笔画比“丨”多;又如,“丿”和“彡”都是活字码承认的字根,穆字拆为“禾白小彡”,而不拆为“禾白少丿”;因为“彡”是多笔画字根,而“丿”是单笔画字根,前一种拆法的字根总体级别较后者高,故选择前者;(2)取连舍断:活字码规定,连笔字根的级别高于散笔字根,对于连接的成字结构,取其中最大的连笔字,而不因局部的书写顺序的先后而拆散它;如:“禾、千、彐、八”都是活字码的字根,“秉”字应拆为“禾+彐”,而不拆为“千+彐+八”;同理,“天”字和“夫”字,都拆为“一大”,而不拆为“二人”,因为“二”字是散笔字,而“大”是连笔字,故优先取用有“大”字根的方案,同理,“干”字,拆为“一十”,而不拆为“二丨”;“或”字拆为“戈口一”,而不拆为“一口一丶”;(3)取少舍多:能够拆成较少个数的字根,不拆成较多个数的字根;例如:“秉”字拆为“禾+彐”,而不拆为“千+彐+八”;又如“董”字,拆为“艹千里”而不拆为“艹千日二”;“方”拆为“广乙”而不拆为“亠丿乙”;4)在前述①的“拆字规范”中,当“局部取舍三项原则”与单字的书写顺序有矛盾时,字根在的总体出现顺序上服从书写顺序;在局部字根的选择上服从“局部取舍三项原则”;5)在前述①的“拆字规范”中,包含对汉字上包围结构的简化规范,(1)三种典型上盖形式及其简化:a)“空”型盖:文字中含有“宀”,“宀”上面没有其他结构,“宀”下面没有八、井等结构,读作kong“空”盖头(就是传统上称为“宝盖头”的偏旁,例如:“宿宅宪宣定富”等字的上盖);b)“穴”型盖:凡上“宀”下“八”的上包围结构,全部合作一个“穴”对待(宀上面没有其他结构,例如:“空窜突容穿窄窥究穷窝窃窒”等字的上盖);例如“空”字拆为“穴工”;c)“寨”型盖:凡有“寨”字中木字以上部分的“宀井一八”上包围结构,“宀井一八”及其以上部分全部合为一个“寨”字头对待(读zhai);如“塞”字拆为“寨土”,“骞”字拆为“寨马”;(2)二十多种非典型上盖形式及其简化:凡带有“冖”的上包围结构,而不符合本条(1)所列a)b)c)三种情况的,例如而不限于“学亮
![]()
孛壳牵帚晏荸蒡带薨赍囊鬓薹睿崇璺爱管夤叠”等二十多种上包围结构;对这些上包围结构中的“冖”及其以上部分全部合为一个“盖”对待,键盘输入键符为“]”,以便简化复杂的上盖结构的输入,缩短编码并提高编码识别率;6)在前述①的“拆字规范”中,对字根“囗”和字根“口”的区别定义为:“囗”内一定要有东西被完全包围着(被包围的东西全部在框内,不得有任何部分突出框外;例如“田、日”的外包围框就符合“囗”的定义要求),“囗”读作“fang”它的输入键是“f”(方框儿),“口”内完全没有东西被包围,或被包围的东西有一部分穿出框外或与框外的部分相连,例如:“曲、中、吕”中的封闭方框就符合“口”的定义要求,“口”的键码是“o”;7)在前述①的“拆字规范”中,规定对“赢、羸、蠃、嬴”这四个字的拆字和编码只取前四个结构:“赢”字拆为“亡口月贝”、“羸”字拆为“亡口月羊”、“蠃”字拆为“亡口月女”、“嬴”字拆为“亡口月虫”;8)在前述①的“拆字规范”中,规定不带右上一点,其余特征和“戈”相同的字根按与“戈”字根同等处理(例如:“尧”字拆为“戈一儿”);9)在前述②的“字根规范”中,包含对296个字根的形态特征和编码特征的定义如下:(1)“字根规范”包含210个单字字根,这些字根被编成工整的《活字码单字字根歌》
广州乃鱼米之乡 白云区车水马龙长足虫非同小可甲骨尸大有文章辟穴人言土里气 立于青山比良田兆句肖乜吕卜韦门户己见执半目手巾业力不由心 分工厂瓦片又干俞此日羽耒者至昔止音夹合少亢
吉林鹿角皮毛衣五台千斤黑木耳豆束金果西瓜王关中丰尧雨亦奇元夕召令乍仓氐匕皿欠了几支矛口舌牙齿充寸臼尤其而且吾告示一二三四六七十弋佥禾尚敖亍酉(一至十,十数全)(谐音:一签和尚熬出油)
永世莫亡九幺八鬼子入屯占牛羊歹丁甫女豸犬走(谐音:逮丁俘女猪犬走)正方齐反矢弓刀前圣单戈革辛亥内儿与友回古娄月火舛舟票曷石(谐音:越火穿州漂褐石)川贝鸟旦享它甘 (注:活字码字根歌不重复,共30句210个字;)
(2)“字根规范”所包含的210个单字字根中,有195个单字字根,直接使用单字的拼音首字母作为输入符号,直观易用;有6个是少用字,需要特别注意;另有9个特殊单字字根不是直接使用单字的拼音首字母作为输入符号,而是使用符号象形方式定义,详见下表:《活字码15个特殊单字字根一览表》
编号字根拼音 键来源定义方式说明拆分规范
1.口kou o字典象形***口字旁有点象字母o,所以记作o冂一
2.门men u字典象形***门冂凵匚因为象大写拼音字母U按不同方向摆放,所以记为u丶丨乙
3.又you v字典象形***由于“V”象中文的一折,所以用“V”代表两个折起的高频偏旁,分别是单笔折“乙”和又字旁“又”乙丶
4.豸zhi z字典字典古代一种神兽名,也有制止之意,读zhi丿丷丿丿
5.幺yao y字典字典表示“一”、“小”等含意,读作腰yao乙厶
6.月yue ,字典起笔****由于“,”有点象一撇,“,”号代表两个撇起的高频偏旁,分别是单笔撇“丿”和月字旁“月”冂二
7.一heng /字典象形****“一”字就是一横,所以用“/”键输入一字或一横一
8.十shi [字典象形****“+”号键下方的“[”键代表两个十字形的高频偏旁,分别是“十”字旁和“木”字旁一丨
9.木mu [字典象形十八
10.耒lei l字典字典耒是一种农具,读垒音lei丰八
11.舛chuan c新建字典两人相对而卧之意,读川音chuan夕匚丨
12.亍chu c新建字典小步行走之意,读处音chu一丁
13.曷he h新建字典什么之意=何,读作何he日勹人乙
14.乜mie m新建字典广州方言“什么”的意思,读咩音mie乙乙
15.吕lv l新建字典上下两口则成吕(上下两口不一定是对齐的,两口简可以有连线,例如:品、官、追、侣、宫等字中都有“吕”)口口
(3)“字根规范”中有59个字根,在《现代汉语词典》的“部首目录”中已有收录:
编 号符号拼音 键来源定义方式说明拆分规范
1.艹ai a字典改约**艾草头,读作艾ai十丨
2.疒bing b字典字典病字旁广冫
3.巛chao c字典改约**巢字头,读作巢chuan(字典标准名称为乙乙乙
“三拐儿”)
4.夂dongd字典字典冬字头,读作冬dong_丶
5.彳ded字典改约**得字旁,读作得de丿亻
6.疋dand字典新约*蛋字头读作蛋dan乙卜人
7.阝ere字典字典双耳旁,读作耳er乙丨
8.彐ee字典象形***雪字底,因为象个反置的拼音大写字母E,所以记作e乙二
9._ee字典新约*厄字底,读作厄e乙乙
10.饣ere字典改约**饿字左旁读作饿e_乙
11. 卩ere字典字典单耳字旁,读作耳er乙丨
12.囗fangf字典字典方匡儿,读作方面军fang冂一
13.攵fanf字典字典反文旁,读作反fan_义
14.犭fanf字典字典反犬旁读作反fan丿乙丿
15.髟faf字典新约*繁体字髪(发)的字头,读发fa镸彡
16.豕huih字典单字旁用***“喙”字底,读作“hui”,记作h,(注:该字原意是一种家畜,原读shi)厂乙丿八
17.讠ii字典象形****“讠”和“辶”在外形上象个拼音小写字母“i”丶乙
18.辶ii字典象形****“讠”和“辶”在外形上象个拼音小写字母“i”丶乙
19.爫ii字典字母近音****是爱字的头顶结构,因为字母i和汉语“爱”同音,所以记作i丿丶丷
20.纟jiaoj字典字典绞丝旁乙乙一
21.廴jianj字典字典建字底,读作jian乙丶
22.扌kongk字典改约**控字旁,读作控kong十一
23.宀kongk字典改约**空字头,读作空kong,(字典标准名称为宝盖头)丶盖
24. 刂kek字典改约**刻刀旁,读作刻ke丨丨
25.冫liangl字典字典凉字旁/两点水(例如:次冷准),读作凉丶一
26._mianm字典新约*免字头读免mian丿乙
27.厶nengn字典改约**能字头,读作能neng,(字典标准名称为私字旁)乙丶
28.廾nongn字典字典弄字底,读作弄nongナ丨
29.丷pup字典新约*普字头丶丿
30.勹pup字典改约**匋字头,读作匋pu(字典标准称为包字头)丿乙
31._pianp字典改约**篇字头,读作篇pian(字典标准“竹字头”)_丶_丶
32.灬pengp字典改约**烹字底,读作烹pang(字典标准“四点儿”)丶丶丶丶
33.彡piep字典字典字典标准名“三撇儿”,读作撇pie丿丿丿
34.礻qiq字典改约*祈字旁读作qi丶乙丨丶
35.氺qiuq字典新约*求字底读求qiu丨 冫八
36.缶queq字典改约**缺字旁读缺que,(原字读fou3,一种有盖_十凵
![]()
(4)“字根规范”中有27个新建偏旁字根,是《现代汉语词典》的“部首目录”未收录的:
![]()
![]()
10)在前述③的“字根编码规范”中,把字根符号转换成电脑键盘符号的编码规范为,把拆分每一个单字所得的四个字根按照其键定义转换成相应的键符号(拼音字母或标点符号)即可;键盘的分区和键定义如下:(1)键盘第一分区,包含四个象形字母键,所代表的字根对应关系如下表:
![]()
![]()
(2)键盘第二分区,包含七个象形标点符号键,所代表的字根对应关系如下表:
![]()
(3)键盘第三分区,笔含22个拼音首字母键,所代表的字根对应关系如下表:
![]()
![]()
备注:除了I、U、O、V四个象形字母键之外的22个拼音字母键,分别代表相应拼音拼音首字母的字根,例如:S代表“山”、G代表“广”、H代表“火”…,依此类推;表中各个字母键上的字根有多有少,但各键的使用率是相近的,因为字根数目多的键,其中字根的出现率较低,而字根数目少的键,其中字根的出现率较高;11)在前述④的“单字编码规范”中,通过使用前述④的“拆字规范”,把单字拆分成符合前述②的“字根规范”的字根组合,再根据前述③的“字根编码规范”,把拆分单字所得的字根组合中的字根转换成键盘输入符号,使字根组合转换成键盘输入符号组合,这种输入符号组合就是单字的输入编码;每个单字的完整的输入编码长度为四个键盘输入符号;为进一步简化编码和提高输入效率,在不构成重码的前提下,部份常用单字仅使用输入编码的前2至3位,构成二级简码字和三级简码字;12)在前述⑤的“词组编码规范”中,对适用于各行各业的汉字通用词组,采用了“以拼音缩写为主,辅以字根形码识别”的词组编码工艺,其规范表述为:(1)述语符号约定:AP1:词组中的第一个字的全拼首字母;BP1:词组中的第二个字的全拼首字母;CP1:词组中的第三个字的全拼首字母;DP1:词组中的第四个字的全拼首字母;EP1:词组中的最后一个字的全拼首字母;AG1:词组中的第一个字的第一个字根的键码;BG1:词组中的第二个字的第一个字根的键码BG2:词组中的第二个字的第二个字根的键码(2)通用词组全码编码规范:(词组全码共5位)①二字词:AP1+BP1+A1+B1+B2例如“喜好”的全码为“xhjnz”(喜x好h吉j女n子z);②三字词:AP1+BP1+CP1+AG1+BG1例如“组织部”的全码为“zzbjj”(组z织z部b纟j纟j);③四字词:AP1+BP1+CP1+DP1+AG1例如“皆大欢喜”的全码为“jdhxb”(皆j大d欢h喜x比b);④多字词(五个或超过五个字):AP1+BP1+CP1+DP1+EP1例如“内蒙古自治区”的全码为“nmgzq”(内蒙古自区); (3)通用简码词完整的活字码通用词组编码包含5个键盘输入符号,为了简化编码和提高输入效率,在不增加重码的前提下,活字码有大量的常用词不必输入5位完整的输入编码,只要输入2到4个键加空格即可输入,这种现象就称为“简码词”,大量的无重码“简码词”能够极大地提高输入效率;例如:“立刻”的简码为“lk”(立l刻k);“常用”的简码为“cy]”(常c用y盖]);“喜好”的简码为“xhjn”(喜x好h吉j女n);组织部”的简码为“zzbj”(组z织z部b纟j);“皆大欢喜”的简码为“jdhx”(皆j大d欢h喜x);“内蒙古自治区”的简码为“nmgz”(内蒙古自);13)在前述⑤的“词组编码规范”中,对只适用于特定行业的汉字专用词组称为“自定义词组”,对“自定义词组”的编码规范为:(1)述语符号约定:AG1:词中第一个字的第一个字根的键码;AG2:词中第一个字的第二个字根的键码;BG1:词中第二个字的第一个字根的键码;BG2:词中第二个字的第二个字根的键码;CG1:词中第三个字的第一个字根的键码;CG2:词中第三个字的第二个字根的键码;DG1:词中最后一个字的第一个字根的键码;(2)活字码的自定义词组编码规范:(自定义词组编码全部统一为4位)①二字词:AG1+AG2+BG1+BG2,如“重码”的自定义码为“qlsm”(千里石马);②三字词:AG1+BG1+CG1+CG2,如“重码率”的自定义码为“qswy”(千石亠幺);③多字词(包含四个或超过四个字的词组):AG1+BG1+CG1+DG1,例如“迪士尼乐园”的自定义码为“y[sf”(由十尸囗)14)在前述⑥的“特殊符号编码规范”中,对箭头符、运算符、罗马数字、圆圈数字、中文数字、带点数字、计量单位、音标符号、希腊字母、几何图型等十类常用的非汉字符号的输入编码为:用特殊符号的分类和特征的拼音缩写即可输入相应的特殊符号,例如:①箭头符(jtf):例如“箭头符左上”=jtfzs=
![]()
②运算符(ysf):例如“运算符不大”=ysfbd“≯”;③罗马数字(szlm):例如“数字罗马二”=lmszb=“II”;④圆圈数字(szyc):例如“数字圆圈三”=szycc=“③”;⑤中文数字(szzw):例如“数字中文四”=szzwd=“(四)”;⑥带点数字(szdd):例如“数字带点五”=szdde=“5.”;⑦计量单位(dwf):例如“单位符KG”=dwfkg=“kg”;⑧音标符号(ybfh):例如“音标符号q”=ybfhq=“θ”;⑨希腊字母(xlzm):例如“希腊字母b”=xlzmb=“β”;⑩几何图型(jht):例如“几何图三”=shtsa=“▲”;15)在前述⑥的“特殊符号编码规范”中,对汉字偏旁符号的编码规范为:输入“un”+该偏旁的拆解码即可:例如:un,,,=彡、un;=丨、un.=丶、un/,=ナ、unv.=マ,等等;16)在前述⑥的“特殊符号编码规范”中,能够十分方便地查询各键所代表的字根,输入“字根学习”四个字的拼音缩写“zgxx”加上想查的键符即可:例如:输入“zgxxc”即打出“厂虫寸车巛此川舛充仓亍镸齿长”;输入“zgxx,”即打出“丿月”等等;