[发明专利]基于聚类的非一致性数据库查询方法在审
申请号: | 201310668188.2 | 申请日: | 2013-12-11 |
公开(公告)号: | CN103605812A | 公开(公告)日: | 2014-02-26 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 湖南人文科技学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 417000 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于聚类的非一致性数据库查询方法,属于数据库查询技术领域。具体包括:(1)多个关系的可信聚类概率的查询重写算法;(2)无连接聚集查询重写算法;(3)基于聚类的有连接聚集查询重写算法。本发明以元组匹配所产生的聚类和元组概率为基础,提出了可信聚类概念和基于概率方法的非一致性数据库查询重写方法。查询重写缩小了结果集中的可信聚类数量,有效地提高了查询性能。此基础上扩展了基于概率方法的聚集查询重写,不但考虑连接查询,而且考虑聚集分组SPJ查询。 | ||
搜索关键词: | 基于 一致性 数据库 查询 方法 | ||
【主权项】:
一种基于聚类的非一致性数据库查询方法,其特征在于:具体包括: (1)多个关系的可信聚类概率的查询重写算法,详细的步骤如下:(1a)在给定的一个SPJ查询中,首先得到查询中的关系个数t和选择条件个数k,初始化重写查询RJ;外循环次数为关系个数,内循环为选择条件个数;在外循环中,取得临时变量存储产生结果集的别名filter,初始化非连接合取谓词集SCW和连接合取谓词属性集AJ;(1b)在第1个内循环中,如果合取选择谓词中的属性是关系中的属性,则判断是否为连接的;如果为非连接合取谓词,则把合取选择谓词中的属性加入到非连接合取谓词属性集SCW中,否则加入到连接合取谓词属性集AJ中;(1c)在第2个内循环中,如果合取选择谓词中的属性是查询中投影属性,把合取选择谓词中的属性加入到连接合取谓词属性集AJ中;(1d)在外循环的最后取得该次循环产生的过滤查询RJ;连接合取谓词属性集SCJ等于合取谓词属性集减去非连接合取谓词属性集SCW;(1e)通过已经取得的产生过滤查询RJ、连接合取谓词属性集SCJ和结果集别名filter,最终输出查询重写语句;(2)无连接聚集查询重写算法,具体算法的基本步骤如下:(2a)首先对初始分组属性G和聚类属性cluster进行分组求聚集属性的最大值、最小值以及期望值和,得到结果集cand;(2b)如果同一聚类内分组属性值不相同,则最小值为0,因此需要去掉这种情况的元组,在产生的结果集cand上对初始分组属性G进行分组求最小值和,得到包含最小值的结果集min_cand;(2c)在结果集cand上对初始分组属性G进行分组求最大值和期望值和,得到包含最大值和期望值的结果集max_cand;(2d)在外查询中,对已经产生的包含最大值和期望值的结果集max_cand左连接到包含最小值的的结果集min_cand;如果连接得到最小值为空,则最小值为0;最终产生初始分组属性G的最值和期望值; (3)基于聚类的有连接聚集查询重写算法,基本步骤如下:(3a)首先初始化重写查询,取得SPJ聚集查询的关系集合R的元素个数、分组属性集合G的元素个数、选择谓词集合SC的元素个数和聚集属性集合E的元素个数;(3b)以关系集合R的元素个数为外循环次数,以选择谓词集合SC的元素个数为内循环次数;在内循环中,如果条件谓词为关系的连接合取选择谓词,则过滤连接值不一致的聚类,取得该次循环中基于连接谓词的查询过滤子结果集;(3c)然后再次以关系集合R的元素个数为外循环次数,初始化结果集标记filter、分组属性集GR、聚集值属性集AE、非连接合取选择谓词集SCW和非连接合取选择谓词集SCJ;在第1个内循环中,以聚集属性集合E的元素个数为内循环次数,如果聚集值属性在该次循环的关系中,聚集值属性加入到聚集值属性集AE;在第2个内循环中,以分组属性集合G的元素个数为内循环次数,如果分组属性在该次循环的关系中,分组属性加入到分组属性集GR;第3个内循环中,以选择谓词集合SC的元素个数为内循环次数,如果连接属性在该次循环的关系中,且选择谓词为连接合取选择谓词,则选择谓词的连接属性加入到分组属性集;如果连接属性在该次循环的关系中,且选择谓词为非连接合取选择谓词,则选择谓词的连接属性加入到非连接选择谓词集;在外循环中,取得本次循环根据非连接选择谓词集和聚类存在于候选集的条件,对聚类属性和分组属性集分组取得概率与聚集属性和的过滤结果集;然后连接选择谓词集SCJ为减去本次循环的非连接选择谓词;(3d)在外查询中,基于上一步产生的过滤结果集进行连接,以连接选择谓词为条件,对分组属性集进行分组聚集求聚集属性的最小值的结果集;基于初始查询,加入聚类属性,对聚集属性求最大值和期望值的候选结果集;再对最大值和期望值的候选结果集左连接最小值的结果集,取得初始查询按照分组属性集的最大值、最小值和期望值的重写语句。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南人文科技学院,未经湖南人文科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310668188.2/,转载请声明来源钻瓜专利网。