[发明专利]一种索引结构和索引方法有效
申请号: | 201310590328.9 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103699569B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 易中华;伍球;徐波 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京维澳专利代理有限公司11252 | 代理人: | 王立民,吉海莲 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种索引结构和索引方法,其中的倒排索引结构包括词表索引文件、词位置索引文件、至少一个词倒排项文件和管理文件;词表索引文件中存储有词与ID的对应关系信息;词位置索引文件中存储有与ID对应的词的倒排项在词倒排项文件中的存储位置信息;该存储位置信息包括块链的第一个结点和最后一个结点的位置信息;每个词倒排项文件均包括相同大小的块,一个块仅存储一个词的倒排项,同一个词的倒排项对应的块形成块链结构,块链结构的第一个结点用于检索,块链结构的最后一个结点用于追加词的倒排项;管理文件中存储有用于管理词倒排项文件的管理信息。本发明可以提高检索速度,并满足用户的检索需求。 | ||
搜索关键词: | 一种 索引 结构 方法 | ||
【主权项】:
一种索引结构,其特征在于,包括:词表索引文件、词位置索引文件、至少一个词倒排项文件以及管理文件;所述词表索引文件中存储有词与其ID的对应关系信息,且所述词表索引文件用于获取待检索词的ID;所述词表索引文件中还存储有每个词对应的标志位,所述标志位用于表示与其对应的词没有经过预搜索、或者与其对应的词经过了预搜索但是没有搜索结果、或者与其对应的词经过了预搜索且有搜索结果;所述词位置索引文件中存储有与所述ID对应的词的倒排项在词倒排项文件中的存储位置信息,且所述词位置索引文件用于根据所述待检索词的ID获取对应的存储位置信息;所述存储位置信息包括块链的第一个结点和最后一个结点的位置信息;每个所述词倒排项文件均包括相同大小的块,所述块中存储有倒排项,且一个块仅存储一个词的倒排项,同一个词的倒排项对应的块形成块链结构,所述块链结构的第一个结点用于检索,所述块链结构的最后一个结点用于追加词的倒排项;所述管理文件中存储有用于管理所述词倒排项文件的管理信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310590328.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种自动适应不同高度的容器的挂盖装置
- 下一篇:香菇精选台