[发明专利]基于结构摘要的XML关键字检索方法有效
申请号: | 200910197333.7 | 申请日: | 2009-10-16 |
公开(公告)号: | CN102043802A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 潘凌云;杨卫东;方非 | 申请(专利权)人: | 上海飞机制造有限公司;复旦大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 郑立柱 |
地址: | 200436*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 结构 摘要 xml 关键字 检索 方法 | ||
1.一种XML关键字检索方法,包括以下步骤:
a.对一个XML树进行深度优先遍历,建立所述XML树的结构摘要树,并对所述结构摘要树的所有节点以及所述XML树的所有叶子节点分别进行编码,以得到各个叶子节点的编码和各个结构摘要树节点的编码;
b.对所述各个叶子节点以及各个结构摘要树节点,以其各自的节点名称或文本值为键,以其各自的编码为值,建立倒排索引;
c.由所述结构摘要树中计算出最小最低公共祖先节点;
d.基于计算出的最小最低公共祖先节点,构造出检索返回结果。
2.根据权利要求1所述的方法,其中,所述步骤a包括:
-通过一次深度遍历,使用Dewey编码对所述XML树的叶子节点进行编码,并建立所述结构摘要树,并用Dewey编码表示所述结构摘要树,从而得到各个叶子节点的编码和各个结构摘要树节点的编码。
3.根据权利要求1所述的方法,其中,所述步骤c包括:
-找出包含用户提供的关键字的节点;
-利用最小最低公共祖先节点算法计算出最小最低公共祖先节点的Dewey编码;
-利用最小最低公共祖先节点的Dewey编码和结构摘要索引找出SLCA节点。
4.根据权利要求1所述的方法,其中,所述步骤d包括:
-以最小最低公共祖先节点v’和包含关键字的节点v1,v2…vk作为输入,得到一个以v’为根节点的最小连通树Ta,作为输出。
5.根据权利要求4所述的方法,其中,所述步骤d包括:
d1.将v1,v2…vk作为叶子节点加入Ta;
d2.对于v1,v2…vk中的每一个节点vi,在结构摘要树中找到一个双亲节点的标识为vi.id的节点vi’,将vi’作为vi的双亲节点加入Ta,以及,在结构摘要树中找到vi’的双亲节点,并将其加入Ta中作为vi’在Ta中的双亲节点,直到v’被加入Ta;
d3.根据每个vi的Dewey编码,将Ta中的节点拆分为满足每个vi的Dewey编码的路径信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海飞机制造有限公司;复旦大学,未经上海飞机制造有限公司;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910197333.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混凝土试块双端面自动磨平机
- 下一篇:一种用于CNC机台的新型水箱