[发明专利]一种能准确输入汉字的无拆分汉字输入集成系统在审
申请号: | 202110257647.2 | 申请日: | 2021-03-09 |
公开(公告)号: | CN115047980A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 刘君度;刘冰彬;陈昌英 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 530001 广西壮族自治区*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 准确 输入 汉字 拆分 汉字输入 集成 系统 | ||
1.一种中文信息处理的汉字编码输入方法,该方法的汉字、词组编码由汉字拼音元素和字形编码元素两部分组成,依据汉字取码规则构成有汉字声形编码方式、形声编码方式、纯字形编码方式、全拼字形辅助编码方式、双拼字形辅助编码方式、模糊编码方式、以及精简版汉字输入法的多编码方式汉字输入集成系统,其特征在于:
(1)所述汉字拼音元素以汉语拼音的首字母为声母代码,没有声母的汉字,以韵母的首字母为代码;
(2)所述字形编码元素的字根是以文字描述汉字字根笔形特征的方式将汉字的编码字根赋与特定的意义进行归类,把大量看似无规律的汉字字根整合为42个按形态特征归类的编码字根,并使之按象形或谐音的关系与26个英文字母建立有理化的映射关联,据此构成有42个编码字根的汉字输入法,缺省其中的“心、中、申、刂、寸、马、乃、与、辶、元、牙、玉、正”13个偏旁部首,余留的29个字根构成一个精简版汉字输入法;
(3)汉字字形的字根代码是根据汉字首笔画、末笔画和右上方的固定位置确定本发明所定义的编码字根并取出对应的字母代码,无需对汉字进行拆分,汉字的字形编码由汉字字形的首笔码、末笔码、识别码、特征码构成,其约定的意义是:
首笔码为汉字首笔画或者与其相连笔画共同构成的字根的英文字母代码;
末笔码为汉字末笔画或者与其相连笔画共同构成的字根的英文字母代码;
识别码为汉字右上方最高处笔画或者字根的英文字母代码;
特征码为去掉汉字识别码,再次取右上方最高处笔画或者字根的英文字母代码;
汉字字形的编码字根对应的英文字母代码如下:
(4)所述汉字字形的取码规则如下:
字形取码规则是根据本发明对汉字首笔码、末笔码、识别码、特征码的定义,取出由汉字的首笔画、末笔画以及右上方笔画所构成的字根代码,字形编码的取码规则如下:
①当首笔码、末笔码、识别码都为同一个笔画或字根时,可以重复取该字根或者笔画的字母代码;
②当一个笔画的上半段和下半段分别与其它的笔画构成不同的字根时,可以分别取各字根对应的字母代码;
③优先取笔画多的大字根的字母代码,没有构成大字根时直接取单笔画;
④当字首是由大方框(囗)、草字头(艹)、病字头(疒)覆盖的汉字,在取右上方的识别码时,应先将其移除后再取识别码。
2.根据权利要求1所述的汉字编码输入方法,声形编码方式的汉字编码,其特征是:汉字声形编码根据汉字编码元素的取码规则,汉字的完整编码由汉字拼音的首字母、首笔码、末笔码、识别码四个编码元素组成,其中识别码是在有编码相同的汉字时才需要输入,汉字声形编码的取码顺序也可作如下表示:
汉字拼音的首字母+首笔码+末笔码+识别码
在声形输入方式下的汉字模糊编码是一种简易输入模式,汉字的识别码无须细分,直接以通用字母代码Y或者Z代替,可快速找到所要的汉字,汉字编码取码顺序可作如下表示:
汉字拼音的首字母+首笔码+末笔码+通用字母代码Y;
汉字拼音的首字母+首笔码+末笔码+通用字母代码Z。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘君度;刘冰彬;陈昌英,未经刘君度;刘冰彬;陈昌英许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110257647.2/1.html,转载请声明来源钻瓜专利网。