[发明专利]查询自动分类的搜索处理有效

专利信息
申请号: 200580047355.5 申请日: 2005-11-29
公开(公告)号: CN101111837A 公开(公告)日: 2008-01-23
发明(设计)人: 希亚姆·卡普尔;吉格纳舒·帕里克;乔希·迪帕 申请(专利权)人: 雅虎公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京康信知识产权代理有限责任公司 代理人: 余刚;尚志峰
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 查询 自动 分类 搜索 处理
【说明书】:

技术领域

总的来说,本发明涉及网络和互联网的搜索以及接口系统,更具体地,涉及提供包括多种功能的增强搜索功能性的搜索系统,其中,根据一种或多种分类系统自动分类搜索查询,以及其中,可从过去的查询和/或关于查询的用户行为自动生成分类系统。

背景技术

随着互联网以及万维网(网络)上用户可用的大量网页和媒体内容的出现,存在向用户提供现代化的方法以过滤并获得来自网络的期望信息的需要。已经开发了搜索系统和进程来满足用户获得期望信息的需求。这种技术的实例可通过Yahoo!、Google、以及其它网站来访问。典型地,用户输入查询,然后搜索进程返回与查询相关的一个或多个链接(在搜索网页的情况下)、文档、和/或参考文献(在不同搜索语料库的情况下)。返回的链接可能与用户实际查找的紧密相关,或者可能与其完全不相关。查询结果的“关联性”部分地可以是所输入实际查询以及所使用的搜索系统(基础收集系统)的稳定性的函数。关联性可以是由用户主观地确定的或者由用户可能正在查找的内容客观地确定的。

用户输入的查询通常地由一个或多个词组成。例如,“Hawaii”是一个查询,所以“New York City”,以及“New York City lawenforcement”也是一个查询。因而,总体来说,查询对人类大脑来说是不完整的。换句话说,人们不会按照查询进行自然思考。它们是部分地由查询搜索引擎或查找库目录的需要而强加的人工构造。人们也不会仅按照单个词来进行自然思考。人类思考的依据是自然概念。例如,“Hawaii”和“New York City”根据对词数的测量是长度完全不同的查询,但它们共享一个重要的特性:它们每个都由一个概念组成。然而,查询“New York City law enforcement”是不同的,其由两个截然不同的概念“New York City”和“lawenforcement”组成。

人们还根据概念之间的逻辑关系进行思考。例如,“法律实施”和“警察”是相关概念,因为警察是法律实施的重要机构;录入这些概念中的一个的用户可能对与其它概念相关的网站感兴趣,即使那些网站不包含用户录入的特定单词或短语。作为这种思考模式的结果,人们通过输入一个或多个自然概念而不是简单的可变长度序列的单个词来自然地建立查询,并且查询通常不包括用户可能知道的所有相关概念。另外,用户意图不必要反映在查询的各个词中。例如,“law enforcement”是一个概念,而分开的词“law”和“enforcement”并不单独传达与组合这两个词相同的用户意图。

搜索提供者使用的当前技术不能以与人们创建它们相同的方式来理解查询。例如,现有搜索引擎通常搜索用户输入的确切的词或短语,而不是基本的自然概念或用户心里实际存在的相关概念。这可能是妨碍搜索提供者确认用户意图和提供最佳搜索结果和内容的最重要的原因。

可以看出,需要提供一种改进的搜索和接口技术,其旨在提供更加符合用户可能感兴趣的实际概念的结果以及更好的用户体验的结果。

发明内容

本发明的实施例提供了一种用于处理搜索请求的系统和方法,包括分析接收到的查询以提供对查找的信息更加精确的理解。例如,基于在查询中一起出现的单位模式,通过将查询分解成单位并定义单位之间的各种关系来从一组查询中生成概念网络。可生成对应于不同查询组(例如,表示不同时间周期或不同地理区域)的大量不同概念网络。根据这些概念网络,可将查询自动分类成类别,或者更通常地,可使查询与一个或多个分类节点相关联。分类可用于改变搜索结果或对用户的表示结果。

作为搜索结果或表示的改变实例,表示可包括对于相关搜索查询项的“建议”列表。作为其它实例,搜索的语料库可根据类别而改变,或者显示给用户的结果的排序和选择可根据类别而改变。

在一些实施例中,使用习得的一组查询节点对进行分类,其中,一个对将特定的查询映射到分类系统中的特定节点。可根据人工指定哪个查询与哪个节点相匹配来初始化习得的组,并且执行随着搜索越来越多而逐渐增强。增强的一种方法包括跟踪后查询点击行为以确定查询的类别估计如何与通过后查询点击行为(例如,查询之后用户选择的搜索结果的特定点击)证明的查询的实际查询类别不同。

在一些实施例中,对于一些单位和概念类别是已知的,并且查询可包含已知的或未知的或者对查询的不同部分的不同类别已知的单位或概念。在这些情况下,可从部分查询的类别和多种类别中推断整个查询的类别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅虎公司,未经雅虎公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200580047355.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top