[发明专利]用于在库文件中查询和/或维护数据的方法和设备无效
申请号: | 201310750372.1 | 申请日: | 2013-12-31 |
公开(公告)号: | CN103778188A | 公开(公告)日: | 2014-05-07 |
发明(设计)人: | 杨柳春 | 申请(专利权)人: | 网秦(北京)科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵伟 |
地址: | 北京市通州*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文件 查询 维护 数据 方法 设备 | ||
技术领域
本发明涉及数据管理领域,更具体地涉及用于在库文件中查询和/或维护数据的方法和设备。
背景技术
随着移动终端的广泛应用,其已经成为了人们在生产、生活中不可或缺的组成部分。受限于移动终端相对有限的处理速度、存储容量以及网络带宽,因此在移动终端上使用的库文件(例如,病毒库、知识库等)难以满足用户在查询和/或维护速度、占用的存储空间等方面的需求。
在现有的设计中,库文件通常包括文件头和数据段。文件头中记载有库文件的元数据,包括例如库文件的版本、库文件中包含的数据记录的数目等。下面以表格方式示出了现有库文件的一个示例。
表1
其中,在表1所表示的库文件中,地址从左至右、从上至下逐渐升高,即文件头左侧为文件头的起始地址(例如,“0x00000000”),文件头右侧为文件头的终止地址(例如,“0x0000001F”),同时也是第一条数据记录的起始地址。此外在表1中,除文件头之外的每个单元格表示一条数据记录,该数据记录由特征项和数据项构成,特征项用于识别相应数据,供用户检索时比对之用,而数据项中存储了用户所需的数据。此外,如表1所示,数据记录可以是不定长的,即每个数据项的长度不固定,且表1所示的文件头和数据记录的长度仅作为示例之用,它们实际的长度可以完全不同。
然而,这种库文件存在很多严重的缺陷。首先,对于查询来说,由于数据记录是可变长度的,因此很难使用例如二分查找法等高效率的查询算法来进行数据查询。此外,该库设计对于插入操作、更新操作、删除操作等常规维护操作极为不友好,为了实现这些操作,需要对库文件中的大量数据记录进行比对、移位、合并等等。
发明内容
为了解决上述问题,提供了根据本发明的用于在库文件中查询和/或维护数据的方法和设备。
根据本发明的第一方面,提供了一种用于在库文件中查询数据的方法,其中,所述库文件至少包括文件头、索引段和数据段,所述文件头至少包括用于定位所述索引段的第一字段,所述索引段包括一条或多条索引记录,每条索引记录至少包括用于识别相应数据记录的第二字段和用于在数据段中定位所述相应数据记录的第三字段,以及所述一条或多条索引记录的长度相同。该方法包括:(a)接收用于在所述库文件中查询数据的查询请求;(b)基于所述第一字段,加载所述索引段;(c)在所述索引段中搜索具有与所述查询请求中包括的数据识别信息相匹配的第二字段的索引记录;以及(d)根据搜索到的索引记录的第三字段来定位并返回相应的数据记录中的全部或部分数据。
在一些实施例中,所述第一字段包括以下各项中的至少两项:所述索引段的起始地址、结束地址、以及长度。
在一些实施例中,每个第二字段至少包括与相应数据记录相对应的数据的散列值。
在一些实施例中,与相应数据记录相对应的数据至少包括恶意应用安装包。
在一些实施例中,每个第三字段包括以下各项中的至少两项:相应数据记录的起始地址、结束地址、以及长度。
在一些实施例中,所述索引段中包括的一条或多条索引记录是按第二字段排序的,以及步骤(c)是通过在所述索引段中使用二分查找算法来实现的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网秦(北京)科技有限公司,未经网秦(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310750372.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动静态连续制备光纤光栅阵列的装置与方法
- 下一篇:压裂车及其传动输送系统