[发明专利]一种文字输入方法和装置有效
| 申请号: | 201010515259.1 | 申请日: | 2010-10-14 |
| 公开(公告)号: | CN102455845A | 公开(公告)日: | 2012-05-16 |
| 发明(设计)人: | 张军;贾剑峰;杨磊 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G06F3/048 | 分类号: | G06F3/048;G06F17/30 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文字 输入 方法 装置 | ||
技术领域
本发明涉及文字输入技术领域,特别是涉及一种文字输入方法和装置。
背景技术
随着外文使用的增多,语言的使用开始互相渗透,中英混合已经越来越成为一种用户习惯。但是,现有输入法提供的英文输入模式、英文补全功能,仍然是泾渭分明地在中文和英文之间划清了界线。这样,用户欲输入一段中英混合文字,需要首先输入中文,在输入英文之前确认中文上屏,然后输入英文、上屏英文,再接着输入中文。
比如使用中文拼音输入法,要输入“按住shift键”,需要先输入“按住”然后确认上屏,再输入“shift”,回车上屏,再输入“键”,上屏,才能完成输入。
由于增加了中英文边界处确认上屏的动作,因而相对于连贯输入中文长句一次上屏的过程,上述中英混合文字的输入效率就比较低,而且会打断思维,降低整个写作过程的效率。因而,文字输入中一个新的需求是,如何使用户在连贯的、不需要分段上屏的过程中输入混合了中文、英文甚至其他语言的语句。
有些输入法通过设计某种特殊的操作来满足这样的需求,如搜狗拼音输入法5.0版,支持通过在输入串中夹杂大写字母、实现中文中间夹杂大写英文单词的输入。例如,可以通过键入“guankanNBAbisai”来输入“观看NBA比赛”。
为满足中文中夹带小写英文单词的需求,本专利发明人提出一种可以推行的中英混输技术方案,该技术方案在完整输入串中判别出英文子串后,将所述英文子串暂时从该完整输入串中分离出来,而其他片段按照中文编码规则解析出中文候选片段,然后把这些中文和英文的片段按照原有的顺序连缀起来形成整个中英混合的候选。参照图1,示出了该技术方案的流程图,具体可以包括:
步骤101、针对完整输入串进行全中文候选构造;
所述中文候选构造,也即按照不支持中英文混合的方式构造出候选,这个候选结果取决于输入法的算法和数据;以完整输入串“anzhushiffjian”为例,假设输入法构造出了唯一全匹配候选“按住是否条件”,并附带给出了这个候选的“正确概率”,其中,所述“正确概率”用以表征其符合用户需求的可能性。
步骤102、识别英文子串,并依据该英文子串将所述完整输入串分解为若干个片段;
这里,可以使用子串匹配的相关技术,从所述完整输入串中识别出英文子串。上例中可被识别出的英文子串是“shift”,对应着输入串第6个字母到第10个字母。将这个英文子串分离出来,则所述完整输入串被分解成三个片段,依次为:中文片段“anzhu”,英文片段“shift”,中文片段“jian”。
步骤103、判别该英文子串属于中文还是英文;
通常情况下英文片段本身也可以按照中文编码解释为中文候选,因而判别结果应该符合用户的意图。所述判别依据可以是上述完整输入串中文候选项的“正确概率”大小,也可以是用户以往的输入习惯,还可以是shift这个英文片段本身的使用概率。
步骤104、如果判别结果为中文,则直接使用上述的全中文候选结果;
此种情况下,则输入法提供的候选项为“按住是否条件”。
步骤105、如果判别结果为英文,则对每个中文片段分别构造中文;
例如,“anzhu”这个中文片段可能构造出中文候选“按住”,“jian”这个中文片段可能构造出“见、煎、键...”等中文候选。
步骤106、组合所有片段的候选。
也即,按照原有片段顺序,将步骤105中构造的中文候选与原英文片段组合起来。在组合时,遇到一个中文片段具有多个中文候选的情形,则会选择“正确概率”最大的那个中文候选;比如,上例中组合出来的中英候选可能会是“按住shift见”
现有的中英混输解决方法虽然能够产生中英文混输的结果,但由于在计算过程中把中文和英文是割裂开来分别处理,没有考虑到它们之间可能的关联关系,具体表现在,其直接把从中文片段匹配出的“正确概率”最大的中文候选和英文片段组合在一起,未必最有可能符合用户意图。上例中,虽然词汇“见”的使用概率比“键”高,但“shift”和“见”字放在一起就不如把“shift”和“键”放在一起合理。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够产生符合用户意图的中英文混输结果。
发明内容
本发明所要解决的技术问题是提供一种文字输入方法和装置,能够在类似中英混输的多种语言渗透场景下,得到符合用户需求的候选项。
为了解决上述问题,本发明公开了一种文字输入方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010515259.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:甘油三醋酸酯碳酸钙活化剂
- 下一篇:晶须/硅橡胶复合材料及其制备方法





