[发明专利]一种XML数据的查询松弛处理方法无效

专利信息
申请号: 200910093492.2 申请日: 2009-09-24
公开(公告)号: CN101692232A 公开(公告)日: 2010-04-07
发明(设计)人: 陆嘉恒 申请(专利权)人: 陆嘉恒
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京中创阳光知识产权代理有限责任公司 11003 代理人: 尹振启
地址: 100872 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 xml 数据 查询 松弛 处理 方法
【说明书】:

技术领域

发明涉及XML数据查询技术领域,尤其是涉及一种XML数据 的查询松弛处理方法。

背景技术

XML作为一种数据表示方式越来越流行,查询松弛处理也由于 XML数据的灵活的模型特征而越来越引起人们的兴趣。查询松弛技术 被广泛的使用到信息检索和关系型数据库中,并且被证明是一种获得近 似结果的有效的技术。与关系型数据库不同的是,关系型数据库的表的 模式是相对较小并且是固定的,而XML模型允许变化的或者缺失的结 构和值,这就使得用户的查询要求难以保证准确和完整。最近的XML 应用需要用户查询他们自己并没有完全了解的XML数据。除此之外, 用户可能由于严格的查询条件而得到空的查询结果。

在图1中,当用户提交一个路径查询“BookRecord/issue/article /authors”,用户将无法得到答案,因为文档中没有准确的能和查询匹配 的结果。这种情况下,用户将会尝试修改原始的查询,如 “BookRecord//issue/article/authors”,“BookRecord/issue//article/authors” 等等,这显然会给用户带来繁琐和不便。

本发明解决了XML松弛路径查询的问题。定义了两个松弛操作, 包括P-C到A-D边的松弛操作和叶子节点删除操作。例如, “BookRecord/issue/article/authors”利用一次P-C到A-D边松弛操作后, 被松弛为“BookRecord/issue//article/authors”,并利用叶子节点删除操作 两次松弛到“BookRecord/issue”。本发明中将P-C到A-D边松弛操作应 用于查询模式的匹配,自动返回近似的结果,并对此方法进行扩展,设 定松弛限制,利用叶子节点删除操作构造松弛查询模式来获得等于或者 小于松弛限制的更多结果。

发明内容

本发明是鉴于上述技术问题而产生的。本发明的一个目的是提出一 种XML数据的查询松弛处理方法。

在一个方面中,根据本发明的XML数据的查询松弛处理方法包括 步骤:A、通过松弛路径查询,得到边松弛结果,并对近似结果进行紧 凑的编码;B、通过递归构造叶子删除查询模式,得到利用叶子结点删 除操作的松弛结果。

在这个方面中,其中步骤A进一步包括:A1、找出要查询的每个 文档路径中最深的查询叶结点元素,并返回该元素的扩展前缀编码; A2、清空所有的堆栈;A3、设定根结点作为父结点;A4、对步骤A1 中的最深查询叶元素的扩展前缀编码进行处理,递归地将其整数编码转 化为祖先结点的名称序列;A5、更新信息,利用祖先结点对堆栈进行 初始化;A6、处理与叶查询结点相关的流中的下一个元素;A7、从结 果文件中输出最近似的结果。

在这个方面中,其中步骤A7进一步包括步骤:初始化结构 minNodeVector;如果当前的最小松弛次数比先前保留的松弛结果的最 小松弛次数大的话,舍弃当前的松弛次数;否则,结果文件和记录的最 小松弛次数将会被更新;对minNodeVector中存入的每个查询叶结点递 归的处理,将松弛结果写入到结果文件中。

在这个方面中,其中步骤B进一步包括:B1、通过进行步骤A, 得到边松弛的松弛结果;B2、从原始查询中删除最后一个叶查询结点; B3、当松弛次数限制值大于0时,则执行步骤A,并递归地从查询中 删除最后一个叶查询结点,同时使松弛次数限制值减1,循环执行步骤 B3,否则,如果松弛次数限制值不大于0,则转到步骤C。

在这个方面中,其中在步骤A5中:将步骤A4中产生的每个祖先 结点置入与其查询结点相应的堆栈中,同时计算出该结点的level、 preNum、change以及path的值,其中level表示结点在XML树中的层 次;preNum是指向它的最后一个上层元素的指针,是上层元素的堆栈 里最顶层的元素;change记录从根结点到当前结点路径的最小松弛次 数;Path记录着导致其最小的change值的上层元素。

在这个方面中,其中进一步包括步骤:计算松弛相似性以对松弛结 果进行评分。

通过本发明,可对每一个文档中的路径计算出每个可能的松弛路径 在初始化元素数据结构的过程中的最少松弛耗费。这样,将会直接在初 始化之后,计算出获得近似结果的最少松弛次数。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陆嘉恒,未经陆嘉恒许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910093492.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top