[发明专利]一种面向知识图谱近似聚集查询的执行代价预测方法在审
| 申请号: | 202110367405.9 | 申请日: | 2021-04-06 |
| 公开(公告)号: | CN113111149A | 公开(公告)日: | 2021-07-13 |
| 发明(设计)人: | 徐小良;富焘;王宇翔 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 知识 图谱 近似 聚集 查询 执行 代价 预测 方法 | ||
1.一种基于线性回归的知识图谱近似聚集查询代价预测方法,其特征在于该方法包括如下步骤:
步骤(1)、样本数据准备阶段
随机取n个区间为[0,1]的误差率e,然后进行近似聚集查询,并记录三个部分的耗时,分别是采样时间TS,样本正确性验证时间TV,近似估计时间Te以及样本量|S|;由此获得的样本数据表示为t=<e,|S|,TS,TV,Te;将样本拆分成训练集和测试集,训练集用于线性回归方法拟合函数,测试集用于验证函数的拟合效果;
步骤(2)、基于线性回归方法的代价模型训练
针对步骤(1)得到的训练集,目标是得到关于问题Q的最终代价与误差率的函数关系;
引入泰勒展开式表示最终的代价函数,将拟合次数n从1开始取到z,得到z组代价函数作为备选,定义代价函数集合为:
R=[T1,T2,…,Ti,…,Tz]
2.1根据各部分代价分析得到,TS、TV与样本量|S|直接相关,对信息<|S|,TS,TV通过线性回归方法训练得到TSV的代价函数:
TSV=TS+TV=f(|S|) (2.1)
2.2近似估计时间Te与误差率e直接相关,对信息<e,Te通过线性回归方法训练得到Te的代价函数:
Te=l(e) (2.2)
2.3误差率e与样本量|S|存在相关性,对信息<e,|S|通过线性回归方法训练得到|S|的函数:
|S|=g(e) (2.3)
综上,由公式(2.1)、(2.2)以及(2.3)得到问题Q的最终代价函数:
T=f(g(e))+l(e) (2.4)
步骤(3)、函数的拟合次数n选择
针对步骤(2)得到的拟合代价函数集合R,利用线性回归性能度量指标来选择最终的结果,度量指标包括:均方差MSE、均方根误差RMSE、平均绝对值误差MAE、决定系数R2;通过将测试集对备选的代价函数进行计算,得到不同拟合次数n对应代价函数的四种指标数值,从备选的代价函数集合R里找到MSE、RMSE、MAE数值最小的,且R2数值最大的拟合结果,代表拟合效果最佳的最终代价函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110367405.9/1.html,转载请声明来源钻瓜专利网。





