[发明专利]一种搜索需求识别方法及装置有效
申请号: | 201110259315.4 | 申请日: | 2011-09-02 |
公开(公告)号: | CN102982029A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 蓝翔;柴春光;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 需求 识别 方法 装置 | ||
技术领域
本申请涉及互联网应用技术领域,特别是涉及一种搜索需求识别方法及装置。
背景技术
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。传统的搜索引擎,在接收到用户的提交的搜索请求(query)后,首先提取该query所包含的关键词,然后基于文本内容匹配操作,将包含有该关键词的网页或文档返回给用户。随着用户对搜索智能化要求的不断提升,搜索需求识别已经成为搜索领域的一个研究热点。
所谓搜索需求识别,就是根据用户所提交的query,分析和预测用户的需求,确定用户的意图或感兴趣的领域,然后再向其提供相应的信息。例如,用户输入“从北京到上海”这样的query,则可以识别出该用户可能具有较强的地图查询需求或票务查询需求,这样就可以在展示搜索结果时,直接向用户提供地图或票务的相关内容,或者将地图或票务的相关内容排在搜索结果的前面,从而方便用户进一步浏览。
搜索需求识别所涉及的关键技术包括语义分析、行为分析、智能人机交互、海量计算处理、信息抽取等等。由于用户query表述方式的多样性,目前一种较为常用的方式是在不同的领域对用户的query进行分析,以实现更有针对性的搜索需求识别。
翻译需求是用户在搜索过程中一种较为常见的需求,根据现有技术,可以在搜索引擎中,预先设定一些特定的表述形式,例如,当用户输入“xxx翻 译”这样的query后,搜索引擎可以根据“翻译”这样明显具有翻译需求的表述,较好地识别出用户具有针对单词“xxx”的翻译需求。但是在实际应用中,用户的query的表达形式是多种多样的,而且很多的表述都隐含有翻译需求,如果仅靠人工搜集这些表述形式并对搜索引擎进行设置,不仅费时费力,而且很难实现全面搜集,从而对翻译需求识别的有效性造成影响。
发明内容
为解决上述技术问题,本申请实施例提供种一种搜索需求识别方法及装置,以实现对用户翻译需求的更有效识别,技术方案如下:
本申请实施例提供一种搜索需求识别方法,包括:
预先获取翻译需求表述模板;
接收到搜索请求后,将搜索关键词与翻译需求表述模板进行匹配,如果匹配成功,则判断所述搜索请求具有翻译需求;
其中,所述获取翻译需求表述模板,包括:
A.选取至少一组已知的双语互译词条;
B.在给定的文档资源中,查找同时包括所述已知双语互译词条的文本段;
C.将所述文本段中的双语词条分别替换为变量,得到翻译需求表述模板。
在本申请方案的一种实施方式中,所述获取翻译需求表述模板,还包括:
D.利用步骤C所得到的翻译需求表述模板,在文档资源中,提取双语互译词条。
在本申请方案的一种实施方式中,所述获取翻译需求表述模板,还包括:
将步骤D所提取的新互译词条作为已知互译词条,重复执行步骤B至步骤C。
在本申请方案的一种实施方式中,所述获取翻译需求表述模板,还包括:
将步骤D所获取的新互译词条作为已知互译词条,循环执行步骤B至步骤D,当步骤D结束后,对提取结果与当前已知的互译词条进行比较,如果新增的互译词条数量小于预设的阈值,则结束循环操作。
在本申请方案的一种实施方式中,在查找同时包括所述已知双语互译词条的文本段之后,还包括:根据预置的过滤规则,对查找到的文本段进行过滤,所述过滤规则包括:
如果在文本段中,双语互译词条之间间隔的词数大于预设的词数阈值,则删除该文本段;
和/或
如果在文本段中,双语互译词条之间包含句子分隔标识,则删除该文本段。
在本申请方案的一种实施方式中,在确定搜索请求具有翻译需求后,还包括对搜索请求对应的翻译结果进行展现,所述翻译结果的展现方法包括:
在搜索框中,展现搜索请求所对应的翻译结果;或
将搜索请求所对应的翻译结果以搜索建议的形式进行展现。
在本申请方案的一种实施方式中,在接收到搜索请求并生成搜索建议之后,还包括:
判断搜索建议的内容是否具有翻译需求。
在本申请方案的一种实施方式中,在确定搜索建议的内容具有翻译需求后,还包括:
将搜索建议对应的翻译内容展现在搜索建议框中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110259315.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种坐垫式多功能保健仪
- 下一篇:四害诱杀器