[发明专利]一种更新用户词库的方法及装置有效
申请号: | 200710302282.0 | 申请日: | 2007-12-24 |
公开(公告)号: | CN101178741A | 公开(公告)日: | 2008-05-14 |
发明(设计)人: | 陈丽菲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/00 |
代理公司: | 北京德琦知识产权代理有限公司 | 代理人: | 罗正云;宋志强 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 更新 用户 词库 方法 装置 | ||
技术领域
本发明涉及输入法,特别涉及一种更新用户词库的方法及装置。
背景技术
随着电子科技的发展,输入法在各个领域都得到了广泛的应用,提供一款准确、快速且人性化的输入法,是很多开发商关注的问题。
目前被广泛使用的输入法一般通过以下步骤实现字符输入:
首先由用户输入指令符,系统根据指令符从用户词库中筛选出指令符所对应的候选词,将候选词根据长词优先原则以及用户输入习惯进行排序并呈现给用户,最终由用户选择需要的候选词作为输入字符输入。这样,就完成了一次字符输入。这里所述的指令符可以为拼音,所述字符可以为中文词语,所述中文词语可以为单个汉字,也可以为多个汉字组成的词。当然,指令符和字符有很多种,比如在日文输入中,日文拼写的指令符对应的字符为日文。
用户输入习惯存储在用户词库中,在用户词库中,中每一个字符都有其对应的用户输入习惯,用户输入习惯包括最后记忆和词频。所述最后记忆是指,用户最后一次输入某个指令符之后,选择了一个输入字符,那么这个输入字符就是这个指令符的最后记忆。所述词频是指,字符被用户输入过的次数。
在用户每输入一次字符之后,系统会进行用户词库更新,这里所述用户词库更新包括:更新所述输入字符在用户词库中对应的用户输入习惯。
更新用户输入习惯包括最后记忆的更新和词频的更新。
所述最后记忆的更新是指:用户每输入一次指令符并在系统根据所述指令符生成的候选词中选择一次字符,系统都会将用户输入的指令符与用户选择的字符记录下来,将所述字符作为所述指令符的最后记忆存入用户词库中。在接下来的输入中,如果用户再次输入这个指令符,系统首先会根据所述指令符筛选出候选词,再将候选词进行排序,那么在排序的过程中,会优先考虑所述指令符的最后记忆。
所述词频的更新是指:对于每个被用户输入过的字符,系统都在用户词库中会记录该字符以及该字符被用户输入过该词的次数,这个被用户输入过的次数就为所述字符的词频。在输入的过程中,用户每输入一次字符,系统就会判断所述字符在之前是否被输入过,如果是,则将用户词库中所述字符的词频加一,否则,将所述字符添加到用户词库中。在之后的输入中,如果用户输入了一个指令符,系统首先会从用户词库中筛选出所述指令符对应的所有字符,然后将筛选出的字符进行排序,那么在排序的过程中,系统在优先考虑了所述指令符的最后记忆之后,会进一步再根据候选词的词频进行排序,词频高的候选词排在前面,词频低的排在后面。
举例来说,用户第一次输入拼音“nh”,然后选择了“你好”,那么系统会判断“你好”在之前有没有被输入过,如果是,则将用户词库中“你好”的词频加一,否则,将“你好”添加在用户词库中;同时系统还会将“nh”的最后记忆更新为“你好”,这里需要说明的是,如果用户下一次再输入“nh”,选择了“女孩”,那么系统会将“nh”的最后记忆更新为“女孩”。
由此可见,用户词库中不断更新的用户输入习惯会影响到候选词的排序,而候选词的排序直接关系到用户使用输入法进行字符输入的准确性和速度,因此对输入法的准确性及可靠性都有着至关重要的作用。
然而在实际应用中,用户词库的更新会存在这样的情况:
用户输入指令符之后,由于在候选词选择的过程中选择失误,将错误的候选词作为了输入字符输入,那么系统会在用户词库中将这个被错误输入的字符的词频加一并将用户输入的指令符的最后记忆更新为这个被错误输入的字符,这使得用户词库更新中,用户输入习惯被更新错误。
接下来,用户在输入错误之后,可能会马上发现并删除这个由于候选词选择错误而被错误输入的字符,然后在所述被删除的字符原来所在的位置重新输入指令符并最终选择正确的候选词作为输入字符输入,这里我们称这个正确的输入字符为之前被删除的字符的更正字符。重新输入的指令符可能会与之前输入的指令符有所不同,比如用户在候选词选择错误的时候采用的是简拼,而发现错误后,为了提高准确性,在输入更正字符时选择全拼,但是两次输入的指令符所候选词中,都是包括所述更正字符的。
然而在上述过程结束后,被更新错误的用户习惯始终不会得到更正,如果用户再次输入了当时输入错误字符时对应的指令符,系统会根据用户词库中错误的词频和最后记忆对筛选出的候选词进行排序,进而导致排序错误,这会给用户接下来根据候选词排序来选择需要的字符带来不必要的干扰,降低了输入字符的准确性和速度。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710302282.0/2.html,转载请声明来源钻瓜专利网。