[发明专利]一种搜索需求识别方法及装置有效

专利信息
申请号: 201110259315.4 申请日: 2011-09-02
公开(公告)号: CN102982029A 公开(公告)日: 2013-03-20
发明(设计)人: 蓝翔;柴春光;吴华 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人: 袁媛
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 搜索 需求 识别 方法 装置
【说明书】:

技术领域

本申请涉及互联网应用技术领域,特别是涉及一种搜索需求识别方法及装置。 

背景技术

搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。传统的搜索引擎,在接收到用户的提交的搜索请求(query)后,首先提取该query所包含的关键词,然后基于文本内容匹配操作,将包含有该关键词的网页或文档返回给用户。随着用户对搜索智能化要求的不断提升,搜索需求识别已经成为搜索领域的一个研究热点。 

所谓搜索需求识别,就是根据用户所提交的query,分析和预测用户的需求,确定用户的意图或感兴趣的领域,然后再向其提供相应的信息。例如,用户输入“从北京到上海”这样的query,则可以识别出该用户可能具有较强的地图查询需求或票务查询需求,这样就可以在展示搜索结果时,直接向用户提供地图或票务的相关内容,或者将地图或票务的相关内容排在搜索结果的前面,从而方便用户进一步浏览。 

搜索需求识别所涉及的关键技术包括语义分析、行为分析、智能人机交互、海量计算处理、信息抽取等等。由于用户query表述方式的多样性,目前一种较为常用的方式是在不同的领域对用户的query进行分析,以实现更有针对性的搜索需求识别。 

翻译需求是用户在搜索过程中一种较为常见的需求,根据现有技术,可以在搜索引擎中,预先设定一些特定的表述形式,例如,当用户输入“xxx翻 译”这样的query后,搜索引擎可以根据“翻译”这样明显具有翻译需求的表述,较好地识别出用户具有针对单词“xxx”的翻译需求。但是在实际应用中,用户的query的表达形式是多种多样的,而且很多的表述都隐含有翻译需求,如果仅靠人工搜集这些表述形式并对搜索引擎进行设置,不仅费时费力,而且很难实现全面搜集,从而对翻译需求识别的有效性造成影响。 

发明内容

为解决上述技术问题,本申请实施例提供种一种搜索需求识别方法及装置,以实现对用户翻译需求的更有效识别,技术方案如下: 

本申请实施例提供一种搜索需求识别方法,包括: 

预先获取翻译需求表述模板; 

接收到搜索请求后,将搜索关键词与翻译需求表述模板进行匹配,如果匹配成功,则判断所述搜索请求具有翻译需求; 

其中,所述获取翻译需求表述模板,包括: 

A.选取至少一组已知的双语互译词条; 

B.在给定的文档资源中,查找同时包括所述已知双语互译词条的文本段; 

C.将所述文本段中的双语词条分别替换为变量,得到翻译需求表述模板。 

在本申请方案的一种实施方式中,所述获取翻译需求表述模板,还包括: 

D.利用步骤C所得到的翻译需求表述模板,在文档资源中,提取双语互译词条。 

在本申请方案的一种实施方式中,所述获取翻译需求表述模板,还包括: 

将步骤D所提取的新互译词条作为已知互译词条,重复执行步骤B至步骤C。 

在本申请方案的一种实施方式中,所述获取翻译需求表述模板,还包括: 

将步骤D所获取的新互译词条作为已知互译词条,循环执行步骤B至步骤D,当步骤D结束后,对提取结果与当前已知的互译词条进行比较,如果新增的互译词条数量小于预设的阈值,则结束循环操作。 

在本申请方案的一种实施方式中,在查找同时包括所述已知双语互译词条的文本段之后,还包括:根据预置的过滤规则,对查找到的文本段进行过滤,所述过滤规则包括: 

如果在文本段中,双语互译词条之间间隔的词数大于预设的词数阈值,则删除该文本段; 

和/或 

如果在文本段中,双语互译词条之间包含句子分隔标识,则删除该文本段。 

在本申请方案的一种实施方式中,在确定搜索请求具有翻译需求后,还包括对搜索请求对应的翻译结果进行展现,所述翻译结果的展现方法包括: 

在搜索框中,展现搜索请求所对应的翻译结果;或 

将搜索请求所对应的翻译结果以搜索建议的形式进行展现。 

在本申请方案的一种实施方式中,在接收到搜索请求并生成搜索建议之后,还包括: 

判断搜索建议的内容是否具有翻译需求。 

在本申请方案的一种实施方式中,在确定搜索建议的内容具有翻译需求后,还包括: 

将搜索建议对应的翻译内容展现在搜索建议框中。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110259315.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top