[发明专利]用于输入法编辑器的浏览历史语言模型在审
申请号: | 201280075563.6 | 申请日: | 2012-08-31 |
公开(公告)号: | CN104813257A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | M·李;X·陈 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 管琦琦 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 输入法 编辑器 浏览 历史 语言 模型 | ||
技术领域
本公开涉及计算机输入的技术领域。
背景
输入法编辑器(IME)是辅助用户将文字输入到计算设备的主机应用中的计算机功能。IME可基于从用户接收到的输入提供若干个建议的词和短语作为用于插入到该主机应用中的候选。例如,用户可以输入词或短语的一个或多个开始字符,并且IME可基于所述开始字符提供一个或多个建议的词或短语以供用户选择一个想要的词或短语。
对于另一示例,IME还可以辅助用户输入非拉丁文字符,比如中文。用户可以通过键盘输入拉丁文字符。IME返回一个或多个中文字符作为供插入的候选。该用户随后可选择适当的字符并插入它。由于许多典型键盘支持输入拉丁文字符,IME有助于用户使用拉丁文字符键盘输入非拉丁文字符。
发明内容
提供本发明内容是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。
一些实现提供用于至少部分地基于浏览历史语言模型来预测非拉丁文字符串的技术和装置。可以基于浏览历史信息来生成浏览历史语言模型。例如,浏览历史信息至少可以包括高速缓存的浏览内容,并且还可以包括实时浏览内容。响应于经由输入法编辑器界面接收到拉丁文字符串,可以提供所预测的非拉丁文字符串。另外,响应于接收到拼音字符串,一些示例可以至少部分地基于浏览历史语言模型来预测中文字符串。
附图说明
参考附图阐述具体实施方式。在附图中,附图标记最左边的数字标识该附图标记首次出现的附图。在不同附图中使用同一附图标记指示相似或相同的项或特征。
图1示出根据某些实现的示例系统。
图2示出根据一些实现的输入法编辑器界面的示例。
图3示出根据一些实现的输入法编辑器界面的示例。
图4示出根据某些实现的示例流程图。
图5示出根据某些实现的示例流程图。
图6示出某些实现可以在其中操作的示例系统。
详细描述
概述
一些示例包括用于通过输入法编辑器(IME)实现浏览历史语言模型的技术和装置。例如,对于基于非拉丁文字符(例如,汉语)语言而言,用户可能难以将字符输入到计算机中。例如,存在数千个中文字符,而典型的西方键盘受限于26个字母。本公开涉及响应于从用户接收到拉丁文字符串而预测非拉丁文字符串的IME。所预测的非拉丁文字符串至少部分地基于浏览历史语言模型。作为说明性而非限定性的示例,IME可以用来将拼音文本(即,由拉丁文字符在语音上表示的中文字符)翻译成中文字符。应当明白,本公开不受限于中文字符。例如,其他说明性的非拉丁文字符可以包括日文字符或韩文字符,等等。
在中文输入法编辑器中,最常见的是那些基于拼音文字的。汉语拼音是一组用拉丁文字母表给中文字符的发音注音的规则。在典型的拼音IME中,用户输入他们想要输入进计算机的中文的拼音文字,并且IME负责显示所有匹配的字符。但是,许多中文字符具有相同的发音。也即,在拼音文字和对应的中文字符间存在一对多关系。为了预测非拉丁文字符窗,IME可以依赖语音模型。例如,统计语言模型(SLM)可被用来计算每个可能转换的转换概率,并选择具有最高概率的一个呈现给用户。称作N-gram SLM的特定类型的SLM可以将一串连续单词的概率分解成该串中两个、三个或更多个连续单词间条件概率之积。
可以发布具有通用用途语言模型(即,“通用”语言模型)的IME,该通用用途语言模型被训练用于最常见的打字场景。然而,这种通用语言模型对于特定的用户(例如,具有特定浏览历史的用户)可能是不适当的。即,不同的用户可以具有不同的偏好,而利用通用语言模型的IME可能建议对于特定用户而言不合适的单词或词组。为了解说,利用通用语言模型的IME可以建议第一单词或词组(即,第一组非拉丁文字符)。该第一单词或词组可以具有与第二单词或词组(即,第二组非拉丁文字符)相同的发音。第一单词或词组对于标准用户而言是合适的,但是对于另一用户而言可能较不合适。取而代之的,第二单词或词组可能对于这种用户更加合适。
Web浏览历史是有关用户的重要信息源。例如,用户可能浏览有关最近新闻事件的内容或者可能浏览用户感兴趣的特殊主题。例如,计算机程序可以针对各种新闻条目浏览一个或多个门户网站,并且还可以浏览一个或多个软件开发网站。由此,用户的浏览历史可以包括与编程技术以及其他信息有关的最新普遍热点主题和文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280075563.6/2.html,转载请声明来源钻瓜专利网。