[发明专利]一种基于汉字输入法下的造词方法和汉字输入设备有效
申请号: | 200910188580.0 | 申请日: | 2009-12-02 |
公开(公告)号: | CN101719018A | 公开(公告)日: | 2010-06-02 |
发明(设计)人: | 张靖 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F9/44 |
代理公司: | 广州三环专利代理有限公司 44202 | 代理人: | 郝传鑫;潘中毅 |
地址: | 518057 广东省深圳市高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 汉字输入法 造词 方法 汉字输入 设备 | ||
技术领域
本发明涉及信息处理技术,尤其涉及一种基于汉字输入法下的造词方法和 汉字输入设备。
背景技术
用户将汉字输入到电脑,需要借助于汉字输入软件,汉字输入软件为运行 于操作系统上的一个工具软件,把键盘输入的编码或其他非键盘输入的媒体数 据转换成汉字输入的软件。键盘汉字输入软件就是利用键盘,根据一定的编码 规则来输入汉字的一种方法。
现有的汉字编码方案已经有数百种,其中在电脑上已经运行的就有几十种, 作为一种图形文字,汉字是由字的音、形、义来共同表达的,汉字输入的编码 方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字进行 组合来完成汉字的输入的。
人们在使用现有汉字输入法的过程中,经常需要输入一些人名、复合词之 类的词语。而多数汉字输入法自带的核心词库不能很好地覆盖这类词语,使得 人们在需要输入这类词语时,只能拆分开按单纯词进行输入,影响了输入体验。
比如现有的极点五笔、万能五笔、智能陈桥、搜狗五笔等五笔输入法已经 实现了智能造词的功能,即在用户输入过程中,将用户连续输入的字组合成词。 虽然目前几种主流五笔输入法中都已经实现了智能造词的功能,但它们的规则 还比较简单:该汉字输入法下的造词规则仅限于单字,只能将连续输入的单字 组合成词,不能将词语与词语组合成新词,即只能实现A+B=AB,不能实现 AB+CD=ABCD;对连续输入没有限制,例如连续输入“工”、“要”、“在”、“地”、 “一”,就能组出“工要在地一”,这样非常容易产生垃圾词;输入法中的造词 规则过于繁琐,难以实现,例如将两个字组合成词,需要将这两个字连续输入, 并且重复两遍。而如果只是一次输入,并不能将它们组合成词。如:乐+扣+ 乐+扣,才能造出“乐扣”这个新词。
发明内容
鉴于上述现有技术所存在的问题,本发明实施例提供了一种基于汉字输入 法下的造词方法及汉字输入设备,通过对用户输入的字词进行相应的词法分析, 方便用户组合出新的输入词语。
为了解决上述技术问题,本发明实施例提供了一种基于汉字输入法下的造 词方法,包括:
提取用户在按键输入过程中输入的选词队列,判断所述选词队列是否包括 至少两个基本输入选词,如果存在至少两个基本输入选词时,则提取所述选词 队列,基于汉字输入法已有词库分析所述选词队列中基本输入选词的词型类别, 所述词型类别为单字、或者包含多个字的词;所述选词队列至少包括两个基本 输入选词,所述基本输入选词为汉字输入法系统词库中的已记录的词或者字;
判断所述选词队列是否符合预先设置的造词约束规则,所述造词约束规则 为:选词队列的字数不超过第一预设值,且选词队列中的基本输入选词的字数 不超过第二预设值以及选词队列中的词数不超过第三预设值;进一步,所述造 词约束规则为:对输入选词为单字和单字组合的选词队列情况下,选词队列中 包含的字数不超过三个字,且不允许三字重复为同一字;对输入选词为单字和 词组合的选词队列情况下,单字不属于词中的字;对输入选词为词和词组合的 选词队列情况下,每个词所包含的字不超过三个,且只允许两个已有词组合造 词;
对满足造词约束规则的选词队列按照汉字输入法规则为新词匹配所对应的 按键输入信息。
所述方法之前还包括:
预先缓存用户每次按键过程中输入的选词队列;或者实时本地存储用户每 次按键输入过程中输入的选词队列。
所述对满足造词约束规则的选词队列按照汉字输入法为新词匹配所对应的 按键输入信息之前还包括:
判断所述满足造词约束规则的选词队列是否为汉字输入法系统词库中的已 有词;
在判断出所述满足造词约束规则的选词队列不是汉字输入法系统词库中的 已有词时,对满足造词约束规则的选词队列按照汉字输入法为新词匹配所对应 的按键输入信息。
所述方法还包括:
对满足造词约束规则的选词队列存储在汉字输入法的词库中。
相应的,本发明实施例还提供了一种汉字输入设备,包括:
获取模块,用于提取用户按键过程中输入的选词队列,所述选词队列至少 包括两个基本输入选词,所述基本输入选词为汉字输入法系统词库中的已记录 的词或者字;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910188580.0/2.html,转载请声明来源钻瓜专利网。