[发明专利]用于存储拼音的存储结构及拼音输入方法无效
申请号: | 201110457831.8 | 申请日: | 2011-12-31 |
公开(公告)号: | CN102521418A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 田友强 | 申请(专利权)人: | 青岛海信宽带多媒体技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 青岛联智专利商标事务所有限公司 37101 | 代理人: | 李升娟 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 存储 拼音 结构 拼音输入 方法 | ||
技术领域
本发明涉及拼音处理技术领域,具体地说,是涉及一种用于存储拼音的存储结构及基于该存储结构的拼音输入方法。
背景技术
在嵌入式系统设备中,如手机、数字机顶盒等,大都需要中文汉字的输入,其中拼音输入是最常用的一种。由于嵌入式系统CPU性能较低、内存等资源较少,因此,嵌入式系统对通过拼音获得汉字的输入方法要求较高,一方面要求输入法高效,对查询结果的筛选及查询效率较高,另一方面,要尽可能地减少对内存的占用。
基于上述嵌入式系统的特殊性,目前在嵌入式系统中,构造拼音外码到汉字内码的转换通常有两种方法:静态数组和有序树。
采用静态数组的方法,也就是将每个拼音(总共300多个)定义为一个数组。这种方法虽然实现简单,但是具有固有的缺点:(1)不便于实现汉字的联想功能;(2)程序运行之初需要为这些数组静态分配内存空间,占用较多的系统资源;(3)查询效率不高。
采用有序树的方法,最常用的就是Trie树。Trie树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。在现有的拼音输入法设计中, Trie树的存储结构为多叉链表,树中的每个结点除根结点外均包括有一个字符,每个结点均包括有1个值域和26个指针域共27个域,而根结点也包括有26个指针域,其中,26个指针域对应于26个英文字母。采用Trie树存储拼音并作为拼音输入结构时,虽然可以提高查找速度,但是,由于每个结点均通过26个指针域指向26个英文字母,而在实际拼音组建时,很多指针域是无效的、也即无法组成拼音,因此,大量无效的指针域占用了相当大的内存空间资源,进而降低了内存的工作效率,导致嵌入式系统整体性能下降。
发明内容
本发明的目的在于提供一种用于存储拼音的存储结构及基于该存储结构的拼音输入方法,以减少存储结构所占的存储空间,提高查找拼音及根据拼音查找汉字的速度。
为实现上述发明目的,本发明所提供的存储结构采用下述技术方案来实现:
一种用于存储拼音的存储结构,所述存储结构为一树形结构,树形结构的根结点包括有指向其一个子结点的指针域,树形结构中除根结点和叶结点之外的其他结点各包括有指向其父结点的指针域、指向其一个子结点的指针域及指向一个兄弟结点的指针域,属于同一层的兄弟结点依次链接形成一个链表,树形结构中的叶结点包括有指向其父结点的指针域。
本发明通过对传统的Trie树进行改进而提出一种新型树形结构的存储结构来存储拼音,根结点仅需要一个指针域指向其一个子结点,其余结点最多通过三个结点分别指向父结点、子结点及兄弟结点,大大减少了结点的指针域,提高了指针域的有效性,降低了存储结构所占用的存储空间,进而可以提高拼音的查找速度。
如上所述的存储结构,为实现对拼音相对应的汉字进行快速定位,所述树形结构中除根结点之外的其他结点还包括有与该结点所包含的拼音字母相对应的关键字、由根结点至该结点的路径构成的拼音对应的汉字在字库中的起始位置值及相同拼音的汉字个数值。
如上所述的存储结构,为进一步提高查找速度,所述属于同一层的兄弟结点依次链接形成的链表中,根据结点的关键字的使用频率对结点排序,形成有序的链表。
如上所述的存储结构,所述指向一个兄弟结点的指针域为指向右兄弟结点的指针域或指向左兄弟结点的指针域,优选为指向右兄弟结点的指针域。
为实现本发明目的,本发明所提供的拼音输入方法采用下述技术方案来实现:
一种拼音输入方法,该方法基于上述所述的用于存储拼音的存储结构,该方法具体包括下述步骤:
根据汉字拼音规则构建树形结构,以存储拼音;
从树形结构的根结点出发,每个拼音字母对应一层结点,沿着与给定的拼音相应的指针逐层向下查找;
在找到与给定的拼音相等的结点后,获取由根结点至该结点的路径构成的拼音对应的汉字在字库中的起始位置值及相同拼音的汉字个数值;
根据起始位置值及汉字个数值从汉字库中读取汉字并显示。
如上所述的拼音输入方法,若查找到树形结构的叶结点仍未找到与给定的拼音相等的结点,则提示拼音输入错误。
如上所述的拼音输入方法,所述拼音输入方法优选应用于数字机顶盒、手机等嵌入式系统设备中,以减少对嵌入式系统设备有限资源的占用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海信宽带多媒体技术有限公司,未经青岛海信宽带多媒体技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110457831.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防治白粉虱的特效配方
- 下一篇:扫频式超声波驱鼠器