[发明专利]基于NL2SQL的BI查询方法、装置、设备及介质有效
申请号: | 202110903845.1 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113656540B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 王攀峰;阮东东;罗义 | 申请(专利权)人: | 北京仁科互动网络技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/34;G06F40/169;G06F40/177;G06F40/194;G06F40/279 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王治东 |
地址: | 100022 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 nl2sql bi 查询 方法 装置 设备 介质 | ||
本发明提供一种基于NL2SQL的BI查询方法、装置、设备及介质,所述方法包括:获取待处理文本的特征向量;根据特征向量和预设的多个表格特征向量计算相似度,根据所述相似度确定出与所述特征向量对应的第一表格;将第一表格的信息和待处理文本输入预先训练好的NL2SQL模型中,获取SQL标签数据;根据SQL标签数据确认所述待处理文本对应的查询结果;其中,NL2SQL模型是根据第一训练样本数据以及与第一训练样本数据对应的SQL标签数据进行训练得到的;其中,第一训练样本数据包括多个样本问题以及与多个样本问题对应的样本表格。本发明提供的查询方法能够提高模型解析识别的准确率和效率,提高问题查询的准确性。
技术领域
本发明涉及数据库技术领域,尤其涉及一种基于NL2SQL的BI查询方法、装置、设备及介质
背景技术
随着信息化的快速发展,数据库的应用越来越普遍,人们希望根据输入的问题能够迅速从数据库中查询到相应的结果。
目前,中文NL2SQL(Natural Language to SQL)技术还尚未成熟,主要面临中文数据集缺乏、查询意图转换缺乏背景知识支撑和模型解析准确率三方面的挑战,另外,部分口语化的简称和描述加大了NL2SQL解析的难度。在企业级应用中,对用户交互有很高的要求,不仅期望能够自动匹配数据表格,对可视化图表类型的输出也有严格的要求。而现有技术中,主流的中文NL2SQL技术都是针对单表查询的,中文NL2SQL模型也都是针对开源数据集训练得到的,业务场景相对单一,表格关系和内容比较简单且局限于固定单表查询,无法动态关联到表格,也没有在企业级BI应用中实现。
发明内容
本发明提供一种基于NL2SQL的BI查询方法、装置、设备及介质,用以解决现有技术中无法动态关联到表格、模型解析准确率低且无法实现企业级应用的技术问题,实现根据动态关联到的表格提高模型解析的准确率和数据库查询效率的目的。
第一方面,本发明提供一种基于NL2SQL的BI查询方法,包括:
获取待处理文本的特征向量;其中,所述待处理文本是与输入的问题相对应的文本;
根据所述特征向量和预设的多个表格特征向量计算相似度,根据所述相似度确定出与所述特征向量对应的第一表格;
将所述第一表格的信息和所述待处理文本输入预先训练好的NL2SQL模型中,获取SQL标签数据;
根据所述SQL标签数据确认所述待处理文本对应的查询结果;
其中,所述NL2SQL模型是根据第一训练样本数据以及与所述第一训练样本数据对应的SQL标签数据进行训练得到的;其中,所述第一训练样本数据包括多个样本问题以及与所述多个样本问题对应的样本表格。
进一步,根据本发明提供的基于NL2SQL的BI查询方法,所述根据所述SQL标签数据得到所述待处理文本对应的查询结果之后,所述方法还包括:
确认所述待处理文本的关键词;
将所述关键词与预设关键词库中的关键词进行匹配,确定所述待处理文本对应的图表类型;
将所述查询结果通过所述图表类型进行渲染并可视化输出;
或,
根据图表类型的维度和指标要求设定的规则,确定所述待处理文本对应的图表类型;
将所述查询结果通过所述图表类型进行渲染并可视化输出。
进一步,根据本发明提供的基于NL2SQL的BI查询方法,在所述获取待处理样本的特征向量之前,包括:
获取多个样本表格数据;
对所述多个样本表格数据分别进行分词处理,得到所述多个样本表格数据各自对应的分词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京仁科互动网络技术有限公司,未经北京仁科互动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110903845.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含醛类杂质的化合物的纯化剂及其应用
- 下一篇:人脸识别方法及系统