[发明专利]一种XML数据的查询松弛处理方法无效
申请号: | 200910093492.2 | 申请日: | 2009-09-24 |
公开(公告)号: | CN101692232A | 公开(公告)日: | 2010-04-07 |
发明(设计)人: | 陆嘉恒 | 申请(专利权)人: | 陆嘉恒 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100872 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 xml 数据 查询 松弛 处理 方法 | ||
技术领域
本发明涉及XML数据查询技术领域,尤其是涉及一种XML数据 的查询松弛处理方法。
背景技术
XML作为一种数据表示方式越来越流行,查询松弛处理也由于 XML数据的灵活的模型特征而越来越引起人们的兴趣。查询松弛技术 被广泛的使用到信息检索和关系型数据库中,并且被证明是一种获得近 似结果的有效的技术。与关系型数据库不同的是,关系型数据库的表的 模式是相对较小并且是固定的,而XML模型允许变化的或者缺失的结 构和值,这就使得用户的查询要求难以保证准确和完整。最近的XML 应用需要用户查询他们自己并没有完全了解的XML数据。除此之外, 用户可能由于严格的查询条件而得到空的查询结果。
在图1中,当用户提交一个路径查询“BookRecord/issue/article /authors”,用户将无法得到答案,因为文档中没有准确的能和查询匹配 的结果。这种情况下,用户将会尝试修改原始的查询,如 “BookRecord//issue/article/authors”,“BookRecord/issue//article/authors” 等等,这显然会给用户带来繁琐和不便。
本发明解决了XML松弛路径查询的问题。定义了两个松弛操作, 包括P-C到A-D边的松弛操作和叶子节点删除操作。例如, “BookRecord/issue/article/authors”利用一次P-C到A-D边松弛操作后, 被松弛为“BookRecord/issue//article/authors”,并利用叶子节点删除操作 两次松弛到“BookRecord/issue”。本发明中将P-C到A-D边松弛操作应 用于查询模式的匹配,自动返回近似的结果,并对此方法进行扩展,设 定松弛限制,利用叶子节点删除操作构造松弛查询模式来获得等于或者 小于松弛限制的更多结果。
发明内容
本发明是鉴于上述技术问题而产生的。本发明的一个目的是提出一 种XML数据的查询松弛处理方法。
在一个方面中,根据本发明的XML数据的查询松弛处理方法包括 步骤:A、通过松弛路径查询,得到边松弛结果,并对近似结果进行紧 凑的编码;B、通过递归构造叶子删除查询模式,得到利用叶子结点删 除操作的松弛结果。
在这个方面中,其中步骤A进一步包括:A1、找出要查询的每个 文档路径中最深的查询叶结点元素,并返回该元素的扩展前缀编码; A2、清空所有的堆栈;A3、设定根结点作为父结点;A4、对步骤A1 中的最深查询叶元素的扩展前缀编码进行处理,递归地将其整数编码转 化为祖先结点的名称序列;A5、更新信息,利用祖先结点对堆栈进行 初始化;A6、处理与叶查询结点相关的流中的下一个元素;A7、从结 果文件中输出最近似的结果。
在这个方面中,其中步骤A7进一步包括步骤:初始化结构 minNodeVector;如果当前的最小松弛次数比先前保留的松弛结果的最 小松弛次数大的话,舍弃当前的松弛次数;否则,结果文件和记录的最 小松弛次数将会被更新;对minNodeVector中存入的每个查询叶结点递 归的处理,将松弛结果写入到结果文件中。
在这个方面中,其中步骤B进一步包括:B1、通过进行步骤A, 得到边松弛的松弛结果;B2、从原始查询中删除最后一个叶查询结点; B3、当松弛次数限制值大于0时,则执行步骤A,并递归地从查询中 删除最后一个叶查询结点,同时使松弛次数限制值减1,循环执行步骤 B3,否则,如果松弛次数限制值不大于0,则转到步骤C。
在这个方面中,其中在步骤A5中:将步骤A4中产生的每个祖先 结点置入与其查询结点相应的堆栈中,同时计算出该结点的level、 preNum、change以及path的值,其中level表示结点在XML树中的层 次;preNum是指向它的最后一个上层元素的指针,是上层元素的堆栈 里最顶层的元素;change记录从根结点到当前结点路径的最小松弛次 数;Path记录着导致其最小的change值的上层元素。
在这个方面中,其中进一步包括步骤:计算松弛相似性以对松弛结 果进行评分。
通过本发明,可对每一个文档中的路径计算出每个可能的松弛路径 在初始化元素数据结构的过程中的最少松弛耗费。这样,将会直接在初 始化之后,计算出获得近似结果的最少松弛次数。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陆嘉恒,未经陆嘉恒许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910093492.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动控制反推式多层彩色混凝土滑模摊铺设备
- 下一篇:皮带输送粉料提升机下轮
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置