[发明专利]一种网络搜索方法及系统无效
申请号: | 200710076116.3 | 申请日: | 2007-06-21 |
公开(公告)号: | CN101075252A | 公开(公告)日: | 2007-11-21 |
发明(设计)人: | 孙良 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳中一专利商标事务所 | 代理人: | 张全文 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 搜索 方法 系统 | ||
1、一种网络搜索方法,其特征在于,所述方法包括下述步骤:
以多元复合语素为索引词建立文件索引,所述多元复合语素中包含多个语素;
将用户输入的检索关键词切分为至少一个多元复合语素,根据切分的多元复合语素进行网络搜索。
2、如权利要求1所述的网络搜索方法,其特征在于,所述根据切分的多元复合语素进行网络搜索的步骤具体为:
根据每个多元复合语素,查询所述文件索引,获取对应的索引表项;
对获取的索引表项依次进行逻辑与操作,获取同时包含每个多元复合语素的文档标识列表;
根据每个多元复合语素在文档中的位置偏移信息进行位置偏移匹配,获取对应的位置偏移匹配文档标识列表;
根据位置偏移匹配文档标识列表中的每个文档的文档标识输出对应的搜索结果。
3、如权利要求2所述的网络搜索方法,其特征在于,所述位置偏移信息为多元复合语素在文档中对应区段的位置偏移信息。
4、如权利要求3所述的网络搜索方法,其特征在于,所述区段为文档中的一个自然句,或者相当于一个自然句长度的文本。
5、如权利要求3所述的网络搜索方法,其特征在于,每个文档划分为64个区段,每个区段的位置偏移信息采用1个比特存储。
6、如权利要求1至5任一权利要求所述的网络搜索方法,其特征在于,所述多元复合语素为2元复合语素,或者3元复合语素。
7、一种网络搜索引擎,其特征在于,所述搜索引擎包括:
索引器,用于以多元复合语素为索引词建立文件索引数据,所述多元复合语素中包含多个语素;
索引数据库,用于存储所述文件索引数据;以及
检索器,用于将用户输入的检索关键词切分为至少一个多元复合语素,根据切分的多元复合语素进行网络搜索。
8、如权利要求7所述的网络搜索系统,其特征在于,所述检索器包括:
检索分词模块,用于将用户输入的检索关键词切分为至少一个多元复合语素;
索引查找模块,用于根据每个多元复合语素,查找所述索引数据库,获取对应的索引表项;
逻辑处理模块,用于对获取的索引表项依次进行逻辑与操作,获取同时包含每个多元复合语素的文档标识列表;
位置偏移匹配模块,用于根据每个多元复合语素在文档中的位置偏移信息进行位置偏移匹配,获取对应的位置偏移匹配文档标识列表;以及
搜索结果输出模块,用于根据位置偏移匹配文档标识列表中的每个文档的文档标识输出对应的搜索结果。
9、如权利要求8所述的网络搜索系统,其特征在于,所述位置偏移信息为多元复合语素在文档中对应区段的位置偏移信息。
10、一种网络搜索方法,其特征在于,所述方法包括下述步骤:
将用户输入的检索关键词切分为至少一个多元复合语素,所述多元复合语素中包含多个语素;
根据切分的多元复合语素进行网络搜索。
11、如权利要求10所述的网络搜索方法,其特征在于,所述根据切分的多元复合语素进行网络搜索的步骤具体为:
根据每个多元复合语素,查询获取对应的索引表项;
对获取的索引表项依次进行逻辑与操作,获取同时包含每个多元复合语素的文档标识列表;
根据每个多元复合语素在文档中的位置偏移信息进行位置偏移匹配,获取对应的位置偏移匹配文档标识列表;
根据位置偏移匹配文档标识列表中的每个文档的文档标识输出对应的搜索结果。
12、如权利要求11所述的网络搜索方法,其特征在于,所述位置偏移信息为多元复合语素在文档中对应区段的位置偏移信息。
13、一种网络搜索中的文件索引方法,其特征在于,所述方法包括下述步骤:
通过分词获取文档的索引词,所述索引词为多元复合语素,所述多元复合语素中包含多个语素;
以所述多元复合语素为索引词建立文件索引。
14、如权利要求13所述的网络搜索中的文件索引方法,其特征在于,所述文件索引信息包含有所述多元复合语素在文档中的位置偏移信息,所述位置偏移信息为所述多元复合语素在文档中对应区段的位置偏移信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710076116.3/1.html,转载请声明来源钻瓜专利网。