[发明专利]对散列序列矩阵的索引和查询有效
申请号: | 201110372972.X | 申请日: | 2011-11-09 |
公开(公告)号: | CN102541995A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | C·W·拉曼纳;M·H·甘地;J·E·布鲁尔 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 在此所述的实施例旨在对索引矩阵中的散列值的序列进行索引和查询。计算机系统访问文档以从该文档中提取文本部分。计算机系统将散列算法应用于所提取的文本。提取的文本的散列值形成散列值的代表序列。计算机系统还将散列值的序列的每个散列值插入到索引矩阵中,该索引矩阵被配置为存储多个不同的散列值序列计算机系统还查询索引矩阵以基于选中的散列值序列中有多少散列值与所述存储的散列值序列的散列值相重叠来确定所述多个散列值序列与选中的散列值序列有多相似。 | ||
搜索关键词: | 序列 矩阵 索引 查询 | ||
【主权项】:
一种在包括多个计算系统的计算机联网环境中在包括处理器和存储器的计算机系统处的计算机实现的方法,所述方法用于对索引矩阵中的散列值的序列进行索引,所述方法包括:访问文档(105)以从所述文档中提取文本(106)的至少一部分的动作;将散列算法(120)应用到一个或多个构造的字单元(116)的动作,其中,所述构造的字单元的散列值形成散列值(121)的代表性序列;以及将散列值(121)的序列的每个散列值插入到索引矩阵(125)中的动作,其中配置所述矩阵来存储多个不同的散列值序列(126)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110372972.X/,转载请声明来源钻瓜专利网。