[发明专利]构建用于基于知识的匹配的特征和索引有效
| 申请号: | 201480068039.5 | 申请日: | 2014-12-09 |
| 公开(公告)号: | CN105814563B | 公开(公告)日: | 2019-07-16 |
| 发明(设计)人: | N·贾殷;L·胡;L·张;R·波塔居;V·弗洛什;M·王;J·K·W·陈 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 罗婷婷 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 此处公开了用于生成包含在知识库中的文档的增强的索引的系统和方法。将文档或配置快照令牌化,然后将它们传递通过多个过滤器。过滤器通过从令牌流中移除单词,并将域级别知识添加到令牌流中的各令牌中来修改该流以生成文档的增强的令牌流。然后,将令牌流添加到文档的索引中,以便当从配置快照或从输入的搜索查询生成搜索时,可以完成相对于知识库的搜索。 | ||
| 搜索关键词: | 构建 用于 基于 知识 匹配 特征 索引 | ||
【主权项】:
1.一种用于索引文档的系统,包括:被配置成拍摄软件产品或计算机系统的配置文件的快照并且生成示例基于知识的文档的配置快照模块,其中所述快照被存储在知识库数据库中;被配置成预处理文档以创建正被转换为纯文本格式的经预处理的文档的预处理组件,其中任何HTML标签或其它嵌入内容被移除;被配置成处理所述经预处理的文档以生成令牌流的分析器,所述令牌流包括所述文档的多个令牌,其中令牌是从所述文档中的单词或单词组创建的,所述令牌被用于对所述文档进行索引或搜索,其中所述纯文本被转换成更小的原子单元,其中所述令牌流中的令牌被传递通过至少一个滤波器以构建增强的令牌流,其中所述分析器进一步包括值类型过滤器,所述值类型过滤器被配置成:从所述令牌中标识与所述令牌相关联的值类型,所述值类型包括数字、真/假以及版本号;以及将数字或布尔的令牌插入到所述令牌流中与标识出的与所述令牌相关联的值类型相对应的位置处;被配置成将所述增强的令牌流添加到所述文档中的索引器,所述增强的令牌流作为所述文档的索引与所述文档相关联,所述索引提供所述知识库数据库中的每一个文档到所述文档的相关联的特征的列表的映射;以及被配置成存储所述文档的所述索引的知识库数据库,其中所述快照以与所述文档相同的方式被处理和索引。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480068039.5/,转载请声明来源钻瓜专利网。





