[发明专利]确定检索结果的方法和装置在审
申请号: | 201810160828.1 | 申请日: | 2018-02-27 |
公开(公告)号: | CN108376170A | 公开(公告)日: | 2018-08-07 |
发明(设计)人: | 杨鹏 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标字符串 检索结果 方法和装置 目标文本 目标字符 信息检索技术 分词处理 检索效率 文本片段 预先存储 检索 | ||
本发明实施例公开了一种确定检索结果的方法和装置,属于信息检索技术领域。所述方法包括:获取待检索的目标字符串;对所述目标字符串进行分词处理,得到所述目标字符串包含的各目标字符;根据预先存储的各字符与文本片段的对应关系,确定包含各目标字符的目标文本片段;将得到的所述目标文本片段,确定为所述目标字符串对应的检索结果。采用本发明,可以提高检索效率。
技术领域
本发明涉及信息检索技术领域,特别涉及一种确定检索结果的方法和装置。
背景技术
随着计算机以及信息检索技术的发展,检索系统的使用越来越广泛,比如,服务器可以检索包含待检索字符串的文本片段。
具体的,用户可以根据自己的需求,通过终端输入待检索字符串,服务器接收到待检索字符串后,可以扫描预先存储的文本数据,即可以以字符为步长,对文本数据与待检索字符串进行匹配,得到包含待检索字符串的文本片段。
在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
基于上述处理方式,服务器需要对文本数据进行扫描,往往扫描需要消耗的时间比较多,从而,导致检索效率较低。
发明内容
为了解决相关技术存在的检索效率较低的问题,本发明实施例提供了一种确定检索结果的方法和装置。所述技术方案如下:
一方面,提供了一种确定检索结果的方法,所述方法包括:
获取待检索的目标字符串;
对所述目标字符串进行分词处理,得到所述目标字符串包含的各目标字符;
根据预先存储的各字符与文本片段的对应关系,确定包含各目标字符的目标文本片段;
将得到的所述目标文本片段,确定为所述目标字符串对应的检索结果。
可选的,所述根据预先存储的各字符与文本片段的对应关系,确定包含各目标字符的目标文本片段,包括:
对于所述各目标字符中的每个目标字符,根据预先存储的各字符与文本片段标识的对应关系,确定所述目标字符对应的文本片段标识;
根据各目标字符对应的文本片段标识,在各目标字符对应的文本片段标识中确定目标文本片段标识;
根据预先存储的文本片段标识与本文片段的对应关系,确定所述目标文本片段标识对应的文本片段,得到包含各目标字符的目标文本片段。
可选的,所述根据各目标字符对应的文本片段标识,在各目标字符对应的文本片段标识中确定目标文本片段标识,包括:
根据各目标字符对应的文本片段标识,确定每个文本片段标识对应的出现次数;
确定对应的出现次数达到各目标字符的数量的目标文本片段标识。
可选的,所述方法还包括:
获取目标文本数据对应的多个文本片段;
为每个文本片段分配文本片段片标识,将每个文本片段和文本片段标识对应添加到所述文本片段标识与文本片段的对应关系中;
对多个文本片段中的每个文本片段进行分词处理,得到每个文本片段包含的各字符,统计多个文本片段包含的各字符分别对应的文本片段标识;
将多个文本片段包含的各字符和分别对应的文本片段标识对应添加到所述各字符与文本片段标识的对应关系中。
可选的,所述将每个字符和对应的文本片段标识对应添加到字符与文本片段标识的对应关系中,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810160828.1/2.html,转载请声明来源钻瓜专利网。