[发明专利]过滤可扩展应用程序标记语言(XAML)文件以便于索引无效
| 申请号: | 200680012902.0 | 申请日: | 2006-03-22 |
| 公开(公告)号: | CN101542455A | 公开(公告)日: | 2009-09-23 |
| 发明(设计)人: | J-M·拉彻弗科;A·舒尔;Y·G·金;D·C·布朗;M·V·雷诺弗;R·A·雷里亚;Z·徐;J·J·迪尼埃兹 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06F15/00 | 分类号: | G06F15/00 |
| 代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈 斌 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 过滤 扩展 应用程序 标记 语言 xaml 文件 便于 索引 | ||
技术领域
本发明涉及计算环境。更具体地,本发明的各个实施例涉及用于过滤以可扩 展应用程序标记语言(XAML)写成的文件并向环境(例如一个搜索引擎)增量地 返回其中所包含的可索引逻辑内容。更具体地,本发明的各个实施例涉及用于提取 XAML文件中所包含的可索引逻辑内容以便于其搜索和/或索引的方法和系统。
发明背景
可扩展应用程序标记语言(XAML)是定义功能上与动态超文本标记语言 (HTML)文件相似的交互式文件的布局和行为的一种特定可扩展标记语言 (XML)模式。搜索文件或建立文件的搜索索引涉及提取文件的可索引逻辑内容, 即文本内容。从XAML文件中提取可索引逻辑内容涉及从中滤除所有格式化和行 为数据。
用XAML写成的文件不能像任意的XML文件一样过滤以索引和/或搜索其中 所包含的可索引逻辑内容,因为这些过滤方法没有考虑标记语义。标记语义包括有 关文本内容的特定实例或特定属性值是否被视为可索引内容而不是非内容(例如结 构信息)的信息。像常规的通用XML过滤器一样,(例如)滤除元素和属性名称 并将所有属性值和文本数据视为内容将导致元数据(非内容)被不当地作为数据返 回。
因此,对于准确地确定文件的内容以搜索和索引应用程序、或需要具体地处 理文件的内容的任何应用程序来说,一种说明标记语义并处理元素和属性的、用于 过滤以XAML写成的文件的方法是合乎需要的。
发明概述
本发明的各个实施例涉及用于过滤可扩展应用程序标记语言(XAML)文件 以便于索引其中所包含的可索引逻辑内容的方法和系统。在一实施例中,该方法包 括:识别XAML文件中的一个元素,通过分析与该元素关联的公共语言运行时 (CLR)类来确定该元素是否包含可索引逻辑内容,以及如果确定该元素包含可索 引逻辑内容,则在与该元素相关的属性值或特征数据中定位该内容,并提取该内容 以便于其索引。
本发明的其它实施例涉及用于提取XAML文件中所包含的可索引逻辑内容以 便于其索引的方法。在一实施例中,该方法包括:识别XAML文件中的用户定义 格式元素,该用户定义格式元素具有与之相关联的代码;分析与用户定义格式元素 相关联的该代码以因此确定一公共语言运行时(CLR)类;以及基于所确定的CLR 类确定该用户定义格式元素是否包含可索引逻辑内容。如果该用户定义格式元素包 含可索引逻辑内容,该方法还可包括定位与该用户定义格式元素相关的属性值或特 征数据中的可索引逻辑内容,并提取所定位的可索引逻辑内容以便于其索引。
在又一实施例中,方法包括:识别表示XAML文件中固定格式页面的元素, 进行在元素中出现的一个或多个纵纹顺串(glyph run)的毗邻性分析以确定有关其 间的距离和共线性的信息,以及考虑语言相关信息以将距离和共线性信息转换成分 字和分段信息以便于其索引。
此外,本发明各实施例涉及具有用于执行本文中所公开方法的计算机可执行 指令的计算机可读介质,以及被编程为执行所公开方法的计算机。
附图概述
本发明在以下参照附图详细描述,在附图中:
图1是适于实现本发明的一示例性计算环境的框图;
图2是示出根据本发明一实施例的系统架构的框图,其中通过再现XAML文 档中的元素从可扩展应用程序标记语言(XAML)过滤器中例示数据元素流;
图3是示出根据本发明一实施例的用于过滤XAML文件以便于索引和/或搜索 其中所包含的可索引逻辑内容的方法的流程图。
发明的详细描述
本发明提供一种用于过滤以可扩展应用程序标记语言(XAML)写成的文件 并增量地向例如搜索引擎的环境返回文件中所包含的可索引逻辑内容、即文本内容 的方法。更具体地,本发明的各个实施例涉及用于提取XAML文件中所包含的可 索引逻辑内容以便于其搜索和/或索引。本文中所公开的方法允许过滤仅包含流格 式元素(即已知和/或用户定义元素)的文件、仅包含表示固定格式页面的元素(例 如纵纹顺串)的文件、和/或包含流格式元素和表示一个或多个固定格式页面的元 素的文件。
在简短描述了本发明的纵览之后,以下描述本发明的一个示例性操作环境。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680012902.0/2.html,转载请声明来源钻瓜专利网。





