[发明专利]全文检索中倒排索引及其追加数据的保存方法及存储装置有效
申请号: | 201210591989.9 | 申请日: | 2012-12-29 |
公开(公告)号: | CN103020299A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 张学;范振勇;崔维力;武新;赵伟 | 申请(专利权)人: | 天津南大通用数据技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 孙春玲 |
地址: | 300384 天津市滨海新区高新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种全文检索系统中的高效保存倒排索引的方法,包括:检测索引单元数据长度是否大于阀值K;如果索引单元数据大于n*K且小于(n+1)*K(n为自然数),将索引单元数据从开始部分至n*K的部分存入索引单元数据数据块,将剩余索引单元数据存入B树中;如果索引单元数据等于n*K,将索引单元数据从开始部分至n*K的部分存入索引单元数据数据块;如果索引单元数据小于K,将索引单元数据全部存入B树中。本发明的有益效果是能够有效的提高倒排文档的全文索引的存储效率,提高了数据读取速率,能够方便实现写时复制(Copy On Write)机制,进而提高了数据安全性和读取数据的并发指标。 | ||
搜索关键词: | 全文 检索 中倒排 索引 及其 追加 数据 保存 方法 存储 装置 | ||
【主权项】:
一种在全文检索系统中的高效保存倒排索引的方法,包括:1)比较索引单元数据长度和预设的阀值K的大小关系;如果索引单元数据长度小于K,将索引单元数据全部存入B树中;2)如果索引单元数据长度小于K,将索引单元数据全部存入B树中;3)如果索引单元数据长度等于K,将索引单元数据从开始部分至K的部分存入索引单元数据数据块;4)如果大于K,则比较索引单元数据长度和n*K(n=2,3,……)的大小关系,并按照下列方式进行存储:1.如果索引单元数据长度大于(n‑1)*K且小于n*K,将索引单元数据从开始部分至n*K部分存入索引单元数据块,将剩余部分存入B树中;2.如果索引单元数据长度等于n*K,将所有索引单元数据按次序存入索引单元数据块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津南大通用数据技术有限公司,未经天津南大通用数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210591989.9/,转载请声明来源钻瓜专利网。