[发明专利]一种用于确定同义文本的方法和装置有效
申请号: | 201210457084.2 | 申请日: | 2012-11-14 |
公开(公告)号: | CN102982125A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 刘钦 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 罗朋 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种用于确定同义文本的方法和装置。本发明对待处理的文本序列进行切词,获得至少一个文本片段;并根据所述至少一个文本片段,在所述文本序列的候选同义序列中进行查询,获得包含所述至少一个文本片段或其同义词中的一个或多个的候选同义序列;并从所述候选同义文本中选择所述文本序列的同义文本。与现有技术相比,本发明能够获得现有技术中难以召回的待处理文本序列的同义词,并能较好地提高待处理文本序列的同义词判断准确性。 | ||
搜索关键词: | 一种 用于 确定 同义 文本 方法 装置 | ||
【主权项】:
一种用于建立或更新候选同义序列库的方法,其中,该方法包括以下步骤:A将待处理的文本序列的第一搜索结果与其待挖掘序列的第二搜索结果进行匹配;其中,该方法还包括以下步骤:X当所述匹配的结果符合第一预定条件时,根据所述待挖掘序列建立或更新所述待处理的文本序列的候选同义序列库;其中,所述第一预定条件包括所述第一搜索结果与所述第二搜索结果包含至少一个相同的搜索结果项。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210457084.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种外圈带有ABS齿圈的汽车轮毂轴承
- 下一篇:汽车内饰安装卡扣