[发明专利]根据句子序列号进行网页搜索的方法和装置有效
申请号: | 201010110315.3 | 申请日: | 2010-02-09 |
公开(公告)号: | CN101923556A | 公开(公告)日: | 2010-12-22 |
发明(设计)人: | 杜一华 | 申请(专利权)人: | 上海莱希信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 王萍萍;丁宪杰 |
地址: | 201112 上海市闵行区联*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种根据句子序列号进行网页搜索的方法和装置。该方法包括以下步骤:A、获取若干网页,并下载至网页数据库;B、对若干网页进行句子分割,并分别为每个网页的句子分配序列号;C、制作前向索引表,前向索引表包括句子序列号;D、制作倒排索引表,倒排索引表包括所述句子序列号;E、输入搜索项,将搜索项分解为至少一个关键字、关键词或标点符号;F、根据倒排索引表,计算包括关键字、关键词或标点符号的网页的排序权值,输出搜索结果。通过本发明的方法和装置,可以提高关键字、关键词或标点符号的句子距离为零或句子距离较小的网页的排序权值,从而使网页的排名靠前,提升用户的搜索满意度。 | ||
搜索关键词: | 根据 句子 序列号 进行 网页 搜索 方法 装置 | ||
【主权项】:
一种根据句子序列号进行网页搜索的方法,其特征在于,包括以下步骤:A)、获取若干网页,并下载至网页数据库;B)、对所述若干网页进行句子分割,并分别为每个网页的句子分配序列号;C)、制作前向索引表,所述前向索引表包括句子序列号;D)、制作倒排索引表,所述倒排索引表包括所述句子序列号;E)、输入搜索项,将所述搜索项分解为至少一个关键字、关键词或标点符号;F)、根据所述倒排索引表,计算包括所述关键字、关键词或标点符号的网页的排序权值,输出搜索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海莱希信息科技有限公司,未经上海莱希信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010110315.3/,转载请声明来源钻瓜专利网。
- 上一篇:防触电安全插座及插头
- 下一篇:认证门户