[发明专利]用于检索与用户相关联的数据的方法和设备在审
申请号: | 201310354410.1 | 申请日: | 2013-08-12 |
公开(公告)号: | CN104376013A | 公开(公告)日: | 2015-02-25 |
发明(设计)人: | 郭杨 | 申请(专利权)人: | 北京千橡网景科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 100041 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检索 用户 相关 数据 方法 设备 | ||
技术领域
本发明的各实施方式总体上涉及信息检索领域,并且更具体地,本发明的各实施方式涉及一种用于检索与用户相关联的数据的方法和设备。
背景技术
随着信息技术的飞速发展,人们越来越多得使用社交网络发布或分享诸如评论、日志、图片之类的各种信息。例如,用户A可以在其主页上发表对近期上映的某部电影的评论。由于该用户A通常也想了解其他人尤其是其好友对该部电影的评论。因此,不可避免地需要在社交网络中检索与用户或其好友相关联的数据。
然而,在目前的社交网站中,通常的做法是:检索时对检索词命中的数据(即,数据中包括用户输入的检索词)进行过滤,如果数据的所有者不是用户或其好友,则将该数据过滤掉进而使得该数据不进行后续的评分、排序和结果返回,从而可以保证返回的结果是满足条件的。这种方法的好处是逻辑简单并且比较通用,以及不需要对额外的字段创建索引。但是该方法存在一个严重的问题,如果检索词的倒排链很长(即,检索词命中的数据很多),例如,检索词“的”或“王”等可能命中成百上千万个结果,则目前至少需要上百毫秒甚至几秒才能完成检索,这是因为整个检索时间与检索词命中的数据的数目成正比。
发明内容
因此,需要提供一种能够动态高效地检索与用户或其好友相关联的数据的方法和设备。为了解决上述问题,在本上下文中,本发明各实施方式的目的之一在于提供一种用于检索与用户相关联的数据的方法和设备。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,例如可以包括:对检索词和用户创建倒排索引;如果所述检索词的倒排链长度没有超过预定阈值,则采用第一方式检索数据;以及如果所述检索词的倒排链长度超过所述预定阈值,则采用第二方式检索数据。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,其中对检索词创建倒排索引可以包括对社交网络中与所述检索词相关联的数据创建倒排索引。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,其中对用户创建倒排索引可以包括对社交网络中与所述用户相关联的数据创建倒排索引。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,其中所述预定阈值可以由预定检索时间确定。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,其中所述预定检索时间可以是50毫秒或者100毫秒。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,其中所述第一方式可以为通过查找用户列表对所述检索词命中的数据进行过滤得到与所述用户相关联的数据。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,其中所述第二方式可以为通过将所述用户命中的数据求并集再与所述检索词命中的数据求交集得到与所述用户相关联的数据。
根据本发明一个方面的某些实施方式,提供了一种用于检索与用户相关联的数据的方法,其中所述数据可以包括以下一种或多种:文本信息、图片信息、音频信息和视频信息。
根据本发明另一方面的某些实施方式,提供了一种用于检索与用户相关联的数据的设备,例如可以包括:创建装置,被配置为对检索词和用户创建倒排索引;第一检索装置,被配置为如果所述检索词的倒排链长度没有超过预定阈值,则采用第一方式检索数据;以及第二检索装置,被配置为如果所述检索词的倒排链长度超过所述预定阈值,则采用第二方式检索数据。
根据本发明另一方面的某些实施方式,提供了一种用于检索与用户相关联的数据的设备,其中对检索词创建倒排索引可以包括对社交网络中与所述检索词相关联的数据创建倒排索引。
根据本发明另一方面的某些实施方式,提供了一种用于检索与用户相关联的数据的设备,其中对用户创建倒排索引可以包括对社交网络中与所述用户相关联的数据创建倒排索引。
根据本发明另一方面的某些实施方式,提供了一种用于检索与用户相关联的数据的设备,其中所述预定阈值可以由预定检索时间确定。
根据本发明另一方面的某些实施方式,提供了一种用于检索与用户相关联的数据的设备,其中所述预定检索时间可以是50毫秒或者100毫秒。
根据本发明另一方面的某些实施方式,提供了一种用于检索与用户相关联的数据的设备,其中所述第一方式可以为通过查找用户列表对所述检索词命中的数据进行过滤得到与所述用户相关联的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京千橡网景科技发展有限公司,未经北京千橡网景科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310354410.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多维数据的处理方法及装置
- 下一篇:一种多功能拧瓶盖机