[发明专利]进行信息搜索的方法及服务器在审
申请号: | 201210182886.7 | 申请日: | 2012-06-05 |
公开(公告)号: | CN103455523A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 谢朴锐 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 周华霞;王丽琴 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 进行 信息 搜索 方法 服务器 | ||
技术领域
本发明涉及信息处理技术,尤其涉及进行信息搜索的方法及服务器。
背景技术
现有的信息搜索方法包括:
用户终端接收用户输入的关键词,向网络侧服务器发送包含关键词的搜索请求;服务器根据关键词在全量倒排数据库中搜索得到网页条目,计算各网页条目的页面得分,由页面得分对搜索出的众多网页条目进行降序排序,将排序后的网页条目反馈给用户终端。而后,用户终端将排序后的网页条目展示给用户,每个网页条目对应一个网页,用户点击某网页条目,便可展示对应的网页。
计算页面得分的方法包括:计算网页条目的页面原始得分和页面因素因子,用页面原始得分乘以页面因素因子,将得到的乘积作为相应页面条目的页面得分。
页面原始得分主要体现的是关键词在页面的重要程度,目前计算页面原始得分的方式有多种,这里以倒排文档频率(IDF,Inverse Document Frequency)计算方法进行说明。例如关键词为“发明”,“发明”在某页面的出现频率,即该页面的原始得分,关键词在页面的出现频率可采用IDF公式计算得到。
用于计算页面得到的页面因素因子包括至少一个,例如包括引用值,引用值为某页面被其他页面引用的几率。参见图1,为现有技术中页面之间引用(链接)关系的实例,其中,页面A被页面B和页面C引用,页面D被页面A引用,则页面A、页面B、页面C和页面D的引用值大小排序为:
页面A>页面D>页面B=页面C。
这里,以关键词“发明”为例,图2示出了搜索后用户终端展示的部分网页条目,包括:关于“中国发明网”的网页条目,关于“《我爱发明》官网”的网页条目,关于“发明搜搜百科”的网页条目,关于“发明专利|发明创造-瞧这网发明专利频道”的网页条目,关于“北京发明协会”的网页条目;图中的省略号为各网页条目的概述。
目前的搜索引擎工具中提供了采用用户标识登陆搜索平台的功能,用户可采用登录状态进行信息搜索。实际应用中,提供搜索引擎业务的运营商可能还提供了其他业务,这些业务都有让用户发表内容的页面;一个用户可能通过同一用户标识使用了除搜索引擎业务外的其他业务,并在这些业务中发表了内容,向服务器上传了网页数据;而每个用户有多个好友,用户在进行信息搜索时,常希望根据输入的关键词搜索好友在其他业务中上传的网页数据,但是,现有的信息搜索方案无法提供好友网页条目,不能满足需求。
例如,腾讯运营商提供的业务包括soso搜索引擎业务、QQ空间业务、腾讯微博业务、腾讯说说业务等;同一用户可能通过同一用户标识使用了除soso搜索引擎业务外的其他业务,还在其他业务中向服务器上传了网页数据,如在QQ空间业务中向QQ空间服务器上传了关于个人日志的网页数据,再如在腾讯微博业务中向腾讯微博服务器上传了关于微博信息的网页数据,所述用户标识具体如QQ账号;当用户A采用腾讯的soso搜索引擎工具(搜索网址为www.soso.com)进行搜索时输入关键词“发明”时,如果soso搜索引擎工具能够同时提供用户A的好友在其他业务中上传的关于“发明”的好友网页条目,将更加遵循用户的查询需求;但目前还没有这样的技术。
发明内容
本发明提供了一种进行信息搜索的方法,该方法能够将好友网页条目显示在搜索结果中,使搜索结果更遵循用户的查询需求。
本发明提供了一种进行信息搜索的服务器,该服务器能够将好友网页条目显示在搜索结果中,使搜索结果更遵循用户的查询需求。
一种进行信息搜索的方法,该方法包括:获取用户的所有网络服务页面信息,存储于用户页面数据库;
接收搜索用户包含关键词的搜索请求;
根据所述关键词在全量倒排数据库中搜索得到公共网页条目,获取各公共网页条目的页面得分;
根据所述关键词在所述用户页面数据库中搜索得到所述搜索用户的所有好友的好友网页条目,获取相应好友网页条目的页面得分;
按照页面得分对搜索得到的公共网页条目和好友网页条目进行降序排序,将排序后的网页条目反馈给所述搜索用户。
一种进行信息搜索的服务器,该服务器包括用户页面数据库生成模块、搜索请求接收模块、第一搜索计算模块、第二搜索计算模块和排序反馈模块;
所述用户页面数据库生成模块,用于获取用户的所有网络服务页面信息,存储于用户页面数据库;
所述搜索请求接收模块,用于接收搜索用户的包含关键词的搜索请求,发送给所述第一搜索计算模块所述第二搜索计算模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210182886.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于车联网的实时数据传输系统及方法
- 下一篇:全成形电脑针织横机复合针
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置