[发明专利]概念上组织和表述信息的方法和系统有效
申请号: | 201110282837.6 | 申请日: | 2004-12-07 |
公开(公告)号: | CN102354313A | 公开(公告)日: | 2012-02-15 |
发明(设计)人: | A·柯蒂斯;A·莱文;A·杰拉索利斯 | 申请(专利权)人: | IAC搜索和媒体公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 周建秋;王凤桐 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 概念上 组织 表述 信息 方法 系统 | ||
本申请是申请号为200480035838.9、申请日为2004年12月7日、名称为“概念上组织和表述信息的方法和系统”的中国发明专利申请的分案申请。
优先权要求
本申请涉及并且要求2003年12月8日提交的临时申请号60/528,139的优先权,其内容作为引用结合于此。
相关申请
本申请涉及2004年5月24号提交的名称为“METHODS AND SYSTEMS FOR CONCEPTUALLY ORGANIZING AND PRESENTING INFORMATION”的美国专利申请,其内容作为引用结合于此。
技术领域
本发明的实施例一般的涉及概念上的组织信息的领域,并且尤其涉及概念相关信息的使用分析以有效组织信息。
背景技术
随着信息的迅速增长,组织信息的能力也在增长。在互联网相关的网络(例如万维网)或者其他互联网源上可以找到大量信息源。互联网是计算机网络的扩展网络,信息通过本领域技术人员公知的方法(例如TCP和IP协议的使用等等)而在互联网上交换。互联网允许用户在连接到该网络的计算机之间发送和接收数据。这些数据可以包括网站、主页、数据库、文本集合、音频、视频或者通过连接到互联网的计算机服务器在互联网上可用的任何其他类型的信息。这些信息可以被称为文件或者文档,并且可以包括网页、网页上的数据、网页附件或者存储设备(例如数据库)中包含的其他数据。
理解如此大量文档集合的意义并且在这种环境中搜索信息,在没有专门的辅助手段时是很困难的。一种辅助定位信息的方法是使用关键词。也就是说,文档可以包括表示包含在文档中的信息的选定部分的关键词。这些关键词在互联网上对其他计算机是可用的并且允许其他计算机定位该文档。
为了定位互联网上的文档,远程计算机的用户使用被称为搜索引擎的搜索程序而搜索关键词。搜索引擎是允许远程用户键入一个或多个搜索词的程序。然后搜索引擎将搜索查询与文档中的关键词相比较并且至少检索文档中具有与搜索查询匹配的关键词的部分。然后搜索引擎对用户显示部分文档,例如标题。用户可以在检索到的局部文档中滚动浏览并且选择所需文档。
早期的关键词搜索引擎显示出严重缺陷。例如,为了增加特定文档的出现率,文档提供者可以使用与文档相关的尽可能多的搜索词。实际上,某些文档或者搜索引擎使用文档中的每个词作为关键词。因此,搜索引擎会检索到大量与用户需要通过搜索词组合寻找的主题无关或者仅边缘相关的文档。并且,这些搜索引擎的很多用户并不熟悉形成关键词搜索查询的技巧并且产生过于宽泛的搜索从而经常检索到数千个文档。那么用户必须检查关于各个文档的摘要信息以定位所需信息。
这种缺陷通过搜索引擎的演变得以解决,即包括基于一个或多个用户的搜索活动的信息组织。这些方法基于用户偏好度多数意见而不是面向文档的参数(例如文本)而对结果排序。其中一种这样的方法根据基于所使用的关键词的演化得分而对文档排序。也就是说,文档接收与搜索查询的关键词相关的相关度分数。随着用户输入搜索查询并且在查询产生的文档列表中选择文档时,文档的相关度分数被调整。这些分数被用于组织文档的结果列表以进行后续搜索。这些方法典型的(至少在部分上)基于文档接收到的“点击”次数(即文档被选择的次数)而确定相关度。这些方法通常称为“人气排序方法”或者“点击人气方法”,提供了将最吸引并且满足最大多数先前用户的文档排列在最前面的搜索结果列表。而且,点击人气方法产生反映搜索上下文的结果。例如,先前的搜索方法会返回包含所有查询词的文档,但是不会自动排除不是查询部分的词。因此,对于“Mexico”的文本匹配搜索最有可能返回关于“New Mexico”的结果。点击人气方法可以减少这种错误结果,因为搜索“Mexico”的用户通常不会点击关于“New Mexico”的页面并且会倾向于点击他们认为与“Mexico”最相关的页面,从而增加了所需文档的相关度。
由于与查询词相关的信息随着时间可能改变,基于点击次数确定相关度可能导致错误结果。例如,对于“民主先驱”的特定查询,涉及早期先驱Howard Dean的文档可能在2003年12月被选择了很多次,但是2004年3月输入该查询的用户可能期望在此时作为领袖的John Kerry的结果。并且,排在最前面的结果通常会受到不成比例的更多的使用,这样导致了越来越歪曲的搜索结果,其中排在最前面的结果永远不会被替代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于IAC搜索和媒体公司,未经IAC搜索和媒体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110282837.6/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置