[发明专利]用于搜索字串的方法和设备在审
申请号: | 201610158006.0 | 申请日: | 2016-03-18 |
公开(公告)号: | CN107203567A | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | 代洪涛;张磊;陈超;黄坤武;刘晶晶 | 申请(专利权)人: | 伊姆西公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 王茂华,马明月 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 搜索 字串 方法 设备 | ||
1.一种用于搜索字串的方法,包括:
确定包含所述字串中的第一项的第一文档集合,以及包含所述字串中的第二项的第二文档集合;以及
基于所述第一文档集合和所述第二文档集合生成第三文档集合,所述第三文档集合中的文档:
i)被包括在所述第一文档集合和所述第二文档集合二者中,并且
ii)所述第一项和所述第二项在所述文档中的距离等于所述第一项和所述第二项在所述字串中的距离。
2.根据权利要求1所述的方法,其中所述确定包括:
确定包含所述字串中的多个项的多个文档集合;以及
根据所述多个文档集合中各自包含的文档数目从少到多的顺序,从所述多个文档集合中选择所述第一文档集合和所述第二文档集合。
3.根据权利要求1所述的方法,其中所述生成第三文档集合包括:
选择被包括在所述第一文档集合和所述第二文档集合二者中的候选文档;
确定所述第一项和所述第二项在所述候选文档中的候选距离是否等于所述第一项和所述第二项在所述字串中的所述距离;以及
响应于所述候选距离等于所述距离,将所述候选文档添加到所述第三文档集合中。
4.根据权利要求3所述的方法,其中所述选择包括:
获取所述第一文档集合和所述第二文档集合的交集;以及
从所述交集中选择所述候选文档。
5.根据权利要求3所述的方法,其中所述确定所述候选距离是否等于所述距离包括:
确定所述第一项在所述候选文档中的第一位置集合;
确定所述第二项在所述候选文档中的第二位置集合;以及
基于所述第一位置集合和所述第二位置集合,来确定所述候选距 离是否等于所述第一项和所述第二项在所述字串中的所述距离。
6.根据权利要求1所述的方法,还包括:
确定包含所述字串中的第三项的第四文档集合;
基于所述第三文档集合和所述第四文档集合生成第五文档集合,所述第五文档集合中的文档:
i)被包括在所述第三文档集合和所述第四文档集合二者中,并且
ii)所述第一项和所述第三项在所述文档中的距离等于所述第一项和所述第三项在所述字串中的距离,并且所述第二项和所述第三项在所述文档中的距离等于所述第二项和所述第三项在所述字串中的距离。
7.根据权利要求1所述的方法,还包括:
通过对所述字串切词,获取所述第一项和所述第二项。
8.一种用于搜索字串的设备,包括:
处理单元,被配置用于:
确定包含所述字串中的第一项的第一文档集合,以及包含所述字串中的第二项的第二文档集合;以及
基于所述第一文档集合和所述第二文档集合生成第三文档集合,所述第三文档集合中的文档:
i)被包括在所述第一文档集合和所述第二文档集合二者中,并且
ii)所述第一项和所述第二项在所述文档中的距离等于所述第一项和所述第二项在所述字串中的距离。
9.根据权利要求8所述的设备,其中所述处理单元被配置用于:
确定包含所述字串中的多个项的多个文档集合;以及
根据所述多个文档集合中各自包含的文档数目从少到多的顺序,从所述多个文档集合中选择所述第一文档集合和所述第二文档集合。
10.根据权利要求8所述的设备,其中所述处理单元被配置用于:
选择被包括在所述第一文档集合和所述第二文档集合二者中的候选文档;
确定所述第一项和所述第二项在所述候选文档中的候选距离是 否等于述第一项和所述第二项在所述字串中的所述距离;以及
响应于所述候选距离等于所述距离,将所述候选文档添加到所述第三文档集合中。
11.根据权利要求10所述的设备,其中所述处理单元被配置用于:
获取所述第一文档集合和所述第二文档集合的交集;以及
从所述交集中选择所述候选文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西公司,未经伊姆西公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610158006.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种折叠式手持电动洗车工具
- 下一篇:电动汽车底盘清洁装置