[发明专利]一种自适应多表连接基数估计的方法和系统在审
| 申请号: | 202310102690.0 | 申请日: | 2023-02-06 |
| 公开(公告)号: | CN116150189A | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 彭朝晖;陈倩;马桢;王一博 | 申请(专利权)人: | 山东大学 |
| 主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/242;G06F16/2455;G06N3/0464 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
| 地址: | 266237 *** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自适应 连接 基数 估计 方法 系统 | ||
1.一种自适应多表连接基数估计的方法,其特征在于,包括:
接收输入的查询语句并分析其包含关系及多表连接的连接关系;
将查询语句的分析结果进行特征向量化,再基于基数估计模型预测出查询语句的基数;
将查询语句转化为数据库查询提示,通过该提示操作的查询优化器,执行查询语句,得出真实基数值;
将查询语句的分析结果对应的特征向量及真实基数值构成训练样本,并对基数估计模型再训练,以学习多表联合查询相关性,用于下次连接基数的估计。
2.如权利要求1所述的自适应多表连接基数估计的方法,其特征在于,所述基数估计模型为多集卷积网络模型。
3.如权利要求2所述的自适应多表连接基数估计的方法,其特征在于,在多集卷积网络模型中,表、连接和谓词表示为单独的模块,每个集合元素由一个两层神经网络组成,具有共享参数;模块输出依次经平均和串联操作后,馈送至最终输出网络。
4.如权利要求1所述的自适应多表连接基数估计的方法,其特征在于,将查询语句的分析结果进行特征向量化的过程为:
将查询语句的分析结果进行编码且表示成唯一的one-hot向量;
再将one-hot向量进行标准化。
5.一种自适应多表连接基数估计的系统,其特征在于,包括:
查询语句分析模块,其用于接收输入的查询语句并分析其包含关系及多表连接的连接关系;
连接基数预测模块,其用于将查询语句的分析结果进行特征向量化,再基于基数估计模型预测出查询语句的基数;
真实基数确定模块,其用于将查询语句转化为数据库查询提示,通过该提示操作的查询优化器,执行查询语句,得出真实基数值;
相关性学习模块,其用于将查询语句的分析结果对应的特征向量及真实基数值构成训练样本,并对基数估计模型再训练,以学习多表联合查询相关性,用于下次连接基数的估计。
6.如权利要求5所述的自适应多表连接基数估计的系统,其特征在于,所述基数估计模型为多集卷积网络模型。
7.如权利要求6所述的自适应多表连接基数估计的系统,其特征在于,在多集卷积网络模型中,表、连接和谓词表示为单独的模块,每个集合元素由一个两层神经网络组成,具有共享参数;模块输出依次经平均和串联操作后,馈送至最终输出网络。
8.如权利要求5所述的自适应多表连接基数估计的系统,其特征在于,在所述连接基数预测模块中,将查询语句的分析结果进行特征向量化的过程为:
将查询语句的分析结果进行编码且表示成唯一的one-hot向量;
再将one-hot向量进行标准化。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的自适应多表连接基数估计的方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任一项所述的自适应多表连接基数估计的方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310102690.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含氟唑菌酰胺的双组分杀菌剂及其制备方法
- 下一篇:红外探测器及其制作方法





