[发明专利]选择用于文本分割的语言的方法和系统有效
申请号: | 201210288916.2 | 申请日: | 2005-09-28 |
公开(公告)号: | CN102831107A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 杰拉德·以色列·埃尔巴兹;雅各布·L·曼德尔森 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了用于选择文本分割的语言的方法和系统。在一个实施例中,识别出与字符串相关联的至少第一备选语言和第二备选语言;至少确定与第一备选语言相关联的第一分割结果和与第二备选语言相关联的第二分割结果;确定第一分割结果出现的第一频率和第二分割结果出现的第二频率;以及至少部分地基于所述出现的第一频率和所述出现的第二频率,从第一备选语言和第二备选语言识别可行的语言。 | ||
搜索关键词: | 选择 用于 文本 分割 语言 方法 系统 | ||
【主权项】:
一种计算机实现的方法,包括:在计算设备处接收字符串;识别针对所述字符串的至少第一备选语言和第二备选语言;通过计算设备将所述字符串至少分割为针对第一备选语言的第一分割结果和针对第二备选语言的第二分割结果,其中所述第一分割结果包括第一多个分割段,所述第二分割结果包括第二多个分割段;使用确定一个或多个第一分割段的正确或优选拼写的拼写检查功能,来确定至少第一分割结果的拼写修正后的分割结果;确定第一分割结果在与第一备选语言相关联的第一语料库中的第一出现频率、第二分割结果在与第二备选语言相关联的第二语料库中的第二出现频率、和拼写修正后的分割结果在与第一备选语言相关联的第一语料库中的第三出现频率;以及通过计算设备至少基于第一出现频率、第二出现频率和第三出现频率来识别针对所述字符串的可操作的分割结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210288916.2/,转载请声明来源钻瓜专利网。