[发明专利]一种数据搜索方法和装置有效
申请号: | 201810040291.5 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108256064B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 朱敏;刘志成;张俊浩 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词索引 文件描述信息 数据标识 索引数据 索引文件 方法和装置 搜索关键词 页高速缓冲 描述信息 数据搜索 加载 内存 存储器查询 结果数据 映射关系 存储器 申请 | ||
本申请提供了一种数据搜索方法和装置,包括:获取描述索引文件的文件描述信息,所述文件描述信息包括关键词索引的描述信息和索引数据的描述信息;所述关键词索引表征关键词与数据标识之间的映射关系;根据所述文件描述信息,由所述索引文件中获取所述关键词索引并加载到页高速缓冲存储器中,由所述索引文件中获取所述索引数据并加载到Java虚拟机内存中;根据搜索关键词由所述页高速缓冲存储器查询所述关键词索引,得到与所述搜索关键词对应的数据标识,根据所述数据标识由所述Java虚拟机内存中的所述索引数据获得结果数据。
技术领域
本申请涉及搜索技术领域,具体而言,涉及一种数据搜索方法和装置。
背景技术
随着互联网技术的兴起,信息呈爆炸式增长,用户希望能够从海量的信息中获取自己关注的内容,由此而诞生了多种搜索引擎。搜索引擎发展伊始主要针对网页搜索,而网页也是传统互联网的主要信息载体。然而近年来,随着互联网技术的发展,用于可以方便的通过移动设备访问互联网,获取服务,由此而兴起了一批线上-线下(Online-to-Offline,O2O)本地生活化服务,极大的方便了人们的生活。与网页不同,O2O行业的信息描述载体往往都具有多个文本域,从不同的角度尝试对服务进行具体的描述,例如,餐饮服务商家可能会包括商家名称、商家注册公司名称、品牌名称、商家所处商圈、商家地址、商家主营菜品、商家营业时间等等字段,这类描述性文本字段有时多达五十个以上。在搜索过程中,不仅要求若干字段命中,也会要求按照一些字段进行排序。随着索引数据量的增多,单个文档的字段数量增多,搜索引擎会面临搜索性能瓶颈,也会面临资源瓶颈。造成搜索引擎性能瓶颈的原因,是在没有增加存储设备的基础上由于数据量增加导致的,数据量增加之后会占用更多的内存,在进行数据检索时,检索效率降低。
发明内容
有鉴于此,本申请的目的在于提供一种数据搜索方法和装置,用于解决现有技术中由于数据量增加导致的检索效率低的问题。
第一方面,本申请实施例提供了一种数据搜索方法,该方法包括:
获取描述索引文件的文件描述信息,所述文件描述信息包括关键词索引的描述信息和索引数据的描述信息;所述关键词索引包括关键词与数据标识之间的映射关系;
根据所述文件描述信息,由所述索引文件中获取所述关键词索引并加载到页高速缓冲存储器中,由所述索引文件中获取所述索引数据并加载到Java虚拟机内存中;
根据搜索关键词由所述页高速缓冲存储器查询所述关键词索引,得到与所述搜索关键词对应的数据标识,根据所述数据标识由所述Java虚拟机内存中的所述索引数据获得结果数据。
可选地,所述文件描述信息包括所述关键词索引和所述索引数据分别在所述索引文件中的起始位置和数据长度;
所述根据所述文件描述信息,由所述索引文件中获取所述关键词索引并加载到所述页高速缓冲存储器中,由所述索引文件中获取所述索引数据并加载到所述Java虚拟机内存中,包括:
根据所述关键词索引在所述索引文件中的所述起始位置和所述数据长度,由所述索引文件中获取所述关键词索引并加载到所述页高速缓冲存储器中;
根据所述索引数据在所述索引文件中的所述起始位置和所述数据长度,由所述索引文件中获取所述索引数据并加载到所述Java虚拟机内存中。
可选地,所述关键词索引包括第一关键词索引;
根据所述关键词索引在所述索引文件中的所述起始位置和所述数据长度,由所述索引文件中获取所述关键词索引并加载到所述页高速缓冲存储器中,包括:
根据所述第一关键词索引在所述索引文件中的所述起始位置和所述数据长度,由所述索引文件中获取所述第一关键词索引并加载到所述页高速缓冲存储器中。
可选地,所述关键词索引还包括第二关键词索引;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810040291.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向网络安全的知识库构建方法
- 下一篇:端到端层次解码任务型对话系统