[发明专利]基于人工智能的数据库索引创建方法及相关设备在审
申请号: | 202111529424.3 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114238698A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张利兵 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9032;G06N20/00 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 陈海云;严林 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 数据库 索引 创建 方法 相关 设备 | ||
1.一种基于人工智能的数据库索引创建方法,其特征在于,所述方法包括:
植入埋点并通过所述埋点捕获应用访问数据库的查询语句;
对所述查询语句进行解析,得到多个搜索关键词和要查询的数据表;
根据所述数据表计算多个预设指标的特征值;
将所述多个预设指标的特征值及所述多个搜索关键词输入至第一随机森林模型中进行预测,得到每个所述搜索关键词对应的第一索引标签;
根据每个所述搜索关键词对应的第一索引标签为所述数据表创建第一索引。
2.如权利要求1所述的基于人工智能的数据库索引创建方法,其特征在于,所述植入埋点并通过所述埋点捕获应用访问数据库的查询语句包括:
在后台应用服务中设置埋点服务SDK;
通过所述埋点服务SDK对外暴露一个数据埋点服务接口;
当侦测到所述应用对所述数据库的访问信号时,调用所述数据埋点服务接口获取所述应用访问所述数据库的查询语句。
3.如权利要求1所述的基于人工智能的数据库索引创建方法,其特征在于,所述第一随机森林模型的训练过程包括:
获取多个所述预设指标的历史特征值及多个历史搜索关键词,作为第一训练数据集;
从所述第一训练数据集中随机抽取k1个训练样本集;
对所述k1个训练样本集进行学习,以此生成k1个决策树,并在所述k1个决策树的生成过程中,从k1个决策树的特征变量中随机抽取F1个特征变量,各个内部节点利用所述F1个特征变量上最优的分裂方式来分支,且F1值在随机森林模型的形成过程中设定为恒定常数;
当满足分支规则时,停止所述k1个决策树的生成过程,得到所述第一随机森林模型。
4.如权利要求3所述的基于人工智能的数据库索引创建方法,其特征在于,所述k1个决策树的生成过程包括:
随机地给每个所述特征变量加入噪声干扰;
依据准确率降低的程度来确定每个所述特征变量的重要度;
依据所述重要度对所述k1个决策树的生成过程进行优化。
5.如权利要求1至4中任意一项所述的基于人工智能的数据库索引创建方法,其特征在于,所述方法还包括:
将所述多个搜索关键词进行两两组合,得到多个组合搜索关键词;
将所述多个预设指标的特征值及所述多个组合搜索关键词输入至第二随机森林模型中进行预测,得到每个所述组合搜索关键词对应的第二索引标签;
根据每个所述组合搜索关键词对应的第二索引标签为所述数据表创建第二索引;
计算多个所述第一索引标签中为预设目标标签值的索引标签的第一数量;
计算多个所述第二索引标签中为所述预设目标标签值的索引标签的第二数量;
对所述第一数量及所述第二数量进行比较,得到比较结果;
根据所述比较结果,确定为所述数据表创建所述第一索引或者所述第二索引。
6.如权利要求5所述的基于人工智能的数据库索引创建方法,其特征在于,所述第二随机森林模型的训练过程包括:
将所述多个历史搜索关键词进行两两组合,得到多个组合历史搜索关键词;
将多个所述预设指标的历史特征值及所述多个组合历史搜索关键词作为第二训练数据集;
基于所述第二训练数据集训练所述第二随机森林模型。
7.如权利要求5所述的基于人工智能的数据库索引创建方法,其特征在于,所述根据所述比较结果,确定为所述数据表创建所述第一索引或者所述第二索引包括:
当所述比较结果为所述第一数量小于所述第二数量时,确定为所述数据表创建所述第一索引;
当所述比较结果为所述第一数量大于所述第二数量时,确定为所述数据表创建所述第二索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111529424.3/1.html,转载请声明来源钻瓜专利网。