[发明专利]海量数据库记录的归档和查询方法无效
申请号: | 200810043784.0 | 申请日: | 2008-09-18 |
公开(公告)号: | CN101676899A | 公开(公告)日: | 2010-03-24 |
发明(设计)人: | 王新春;代真虎;徐培杰 | 申请(专利权)人: | 上海宝信软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海浦一知识产权代理有限公司 | 代理人: | 丁纪铁 |
地址: | 201203上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 海量 数据库 记录 归档 查询 方法 | ||
1、一种海量数据库记录的归档方法;其特征在于,包括如下步骤:
(1)在数据库中获取一个需要归档的表中的记录;
(2)将步骤(1)获取的记录进行分组;
(3)对分组后的各组记录建立索引文件;
(4)对建立好索引文件的组进行数据压缩后归档;
(5)重复步骤(3)和步骤(4)直至步骤(1)获取的记录全部归档;
(6)若所述数据库中还有未归档的表,则返回步骤(1)。
2、如权利要求1所述的海量数据库记录的归档方法,其特征在于,步骤(2)所述分组是将所述海量数据库记录按照每组固定记录数量的方式进行分组。
3、如权利要求1所述的海量数据库记录的归档方法,其特征在于,步骤(3)所述的建立索引文件包括如下步骤:
(1)对每条记录需要查询的每个字段建立相应的倒排索引;
(2)对需要支持模糊查询或全文搜索的字段的文本进行分词;
(3)将同一个表中需要归档的记录建立一个索引文件。
4、如权利要求1所述的海量数据库记录的归档方法,其特征在于,当步骤(2)中包括可转换为数字类型的数据记录时,先转换为数字数据后再索引和压缩归档。
5、如权利要求1所述的海量数据库记录的归档方法,其特征在于,步骤(3)对一组记录建立索引文件时,包括计算该组记录压缩后的大小,并将该组记录中每条记录在数据文件中的确切位置作为记录的文件指针,写入索引文件中。
6、如权利要求5所述的海量数据库记录的归档方法,其特征在于,所述文件指针包括:当前记录的压缩块在数据文件中的位置、记录压缩块的压缩前后大小及所述记录在压缩块中的序号。
7、一种海量数据库记录的查询方法;其特征在于,包括如下步骤:
(1)解析用户输入的查询条件,去掉无意义的查询条件和影响系统正常运行的特殊字符;
(2)在索引文件中找到含有关键字的记录索引,根据记录的文件指针确定记录所在数据块在存档文件中的位置及记录在其所在数据块中的位置;
(3)根据记录所在数据块在存档文件中的位置查找并解压缩相应数据块文档,进一步根据记录在数据块中的位置查询到完整的数据记录。
8、如权利要求7所述的海量数据库记录的查询方法,其特征在于,步骤(2)所述在索引文件中找到含有关键字的索引记录包括输入的查询条件进行分词,将分词后的结果到对应字段的索引中进行查询。
9、如权利要求7所述的海量数据库记录的查询方法,其特征在于,当步骤(1)输入的查询条件为多个时,按照逻辑关系组合查询条件。
10、如权利要求9所述的海量数据库记录的查询方法,其特征在于,步骤(1)输入的查询条件包含在归档建立索引中转换过的数字数据类型时,先将该查询条件转换成数字数据类型,并根据数字数据范围确定查询区域的范围。
11、如权利要求7所述的海量数据库记录的查询方法,其特征在于,步骤(3)完成后将结果通过Web界面或者其他图形界面返回给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝信软件股份有限公司,未经上海宝信软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810043784.0/1.html,转载请声明来源钻瓜专利网。