[发明专利]基于人工智能的数据标准提取方法、装置、设备及介质在审

专利信息
申请号: 202310152800.4 申请日: 2023-02-16
公开(公告)号: CN116150185A 公开(公告)日: 2023-05-23
发明(设计)人: 李健智;贺春艳;梁子敬;秦魏 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/2452 分类号: G06F16/2452;G06F40/126
代理公司: 深圳市赛恩倍吉知识产权代理有限公司 44334 代理人: 陈敬华
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请提出一种基于人工智能的数据标准提取方法、装置、电子设备及存储介质,基于人工智能的数据标准提取方法包括:采集业务数据库中的业务数据获得业务基础数据集;提取所述业务基础数据集中的码值类字段以获取枚举值列表;基于所述码值类字段生成字段向量以获得多种类别的字段组;计算所述枚举值列表之间的相似度以构建码值相似度矩阵;基于所述码值相似度矩阵构建连通图获得多个字段连通图;提取所述码值类字段的码值信息,并基于所述字段连通图对所述码值信息进行融合获得所述业务数据库的数据标准。本申请可综合考虑字段注解中码值信息和字段间的关联关系,并利用图算法获取数据标准,从而减少数据标准的冗余度,提升数据库的使用效率。
搜索关键词: 基于 人工智能 数据 标准 提取 方法 装置 设备 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310152800.4/,转载请声明来源钻瓜专利网。

同类专利
  • SQL语句生成方法、装置、电子设备及存储介质-202310946470.6
  • 谭华 - 广州商研网络科技有限公司
  • 2023-07-28 - 2023-10-27 - G06F16/2452
  • 本申请提供一种SQL语句生成方法、装置、电子设备及存储介质,SQL语句生成方法包括:接收对数据库进行操作的数据操作需求;根据所述数据操作需求,从所述数据库中的多个数据表描述信息中确定至少一个目标描述信息;根据所述目标描述信息与预先构建的提示模板确定所述数据操作需求对应的提示信息;通过输入所述提示信息至生成式预训练模型生成目标SQL语句。本申请能够提升生成的SQL语句的准确度,以提升对数据库操作的效率。
  • 一种基于大语言模型解析流程挖掘PQL的方法和系统-202310956341.5
  • 杨清泉;陈小格;胡世超;郑智先;郑瑶海;韩俐敏 - 北京璇星科技有限公司
  • 2023-08-01 - 2023-10-27 - G06F16/2452
  • 本发明公开了一种基于大语言模型解析流程挖掘PQL的方法和系统,涉及流程查询语言技术领域,所述基于大语言模型解析流程挖掘PQL的方法包括下述操作:S1、建立大语言模型;S2、知识库与解释准备;S3、PQL分析提示;S4、PQL语句解释;S5、局部高亮显示;S6、PQL语句微调。该基于大语言模型解析流程挖掘PQL的方法和系统,通过利用大语言模型对用户输入的PQL语句加以解析,并将其转换为易于理解的自然语言文本,以帮助用户快速理解PQL的具体含义,从而无需人工介入,通过反馈可读性高的自然语言解析结果,便于用户阅读理解的同时可降低用户对PQL语句的理解要求。
  • 一种数据搜索的方法和装置-202210387610.6
  • 李晓;蔡森;董鹏军;连大湖 - 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司
  • 2022-04-14 - 2023-10-27 - G06F16/2452
  • 本发明公开了一种数据搜索的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据搜索条件表达式得到状态集合,以及所述状态集合中状态之间的转换关系;根据所述状态之间的转换关系得到每个状态的转换规则;根据所述每个状态的转换规则和所述搜索条件表达式,从输入数据集合中搜索目标数据。该实施方式不仅满足了各种数据类型的搜索条件的数据搜索和提取,而且提高了复杂搜索条件的搜索效率,从而保证了后续数据应用的准确性和实时性。
  • 一种执行MongoDB原生语句的设计方法及装置-202310531206.6
  • 请求不公布姓名 - 深圳彩凤软件科技有限公司
  • 2023-05-03 - 2023-10-24 - G06F16/2452
  • 一种执行MongoDB原生语句的设计方法及装置,解决MongoDB提供的驱动API不能直接运行MongoDB原生语句,开发成本高的问题。主要步骤:1原生语句传入SUID接口,2提取集合名称和操作类型,3根据操作类型选解析方法,4提取和分类元数据,5用元数据重组参数,6调用驱动API,7解析结果,8返回最终结果。步骤2至8是装置自动完成的。采用直接遍历查找的字符串的解析方法:允许原生语句有单行注释和多行注释;原生语句语法可以允许的空格、换行符、水平制表符等可以解析;能定位关键字所在的位置,提取关键字之间的字符串,支持嵌套;关键字可以严格匹配和宽松匹配。缓存功能,可提高查询性能;更改操作时,只删除与集合名关联的缓存,避免返回脏数据。
  • 自然语言查询的转换-201910108419.1
  • 陈蓓;楼建光;高妍;张冬梅 - 微软技术许可有限责任公司
  • 2019-01-18 - 2023-10-24 - G06F16/2452
  • 根据本公开的实现,提出了一种用于转换自然语言查询的方案。在该方案中,针对一个或多个数据表的第一自然语言查询和第二自然语言查询被接收,其中第二自然语言查询的语义依赖于第一自然语言查询。基于第一自然语言查询和第二自然语言查询来生成针对一个或多个数据表的第三自然语言查询,其中第三自然语言查询的语义与第二自然语言查询的语义相同,并且不依赖于第一自然语言查询。以此方式,该方案能够将依赖于上下文的自然语言查询转换成上下文无关的自然语言查询,从而能够与实现从自然语言查询到计算机可执行查询的转换的任何语义解析器对接,以实现针对一个或多个数据表的查询操作。
  • 用于分布式数据系统的语义搜索系统和方法-202310910180.6
  • 菲利普·纳佩;赫尔夫·雅凯;沙尔贝勒·约瑟夫·埃尔凯德 - 施耐德电气美国股份有限公司
  • 2017-03-30 - 2023-10-17 - G06F16/2452
  • 本公开涉及用于分布式数据系统的语义搜索系统和方法。提供了用于在分布式数据处理系统中搜索信息的方法和系统。一种用于处理语义搜索查询的系统,其中该系统可以包括存储器和耦合到该存储器的处理器,该处理器被配置成接收结构化搜索查询、处理该结构化搜索查询以解构到查询元素、基于处理的查询元素识别定义与接收到的结构化搜索查询相关联的数据源的一组连接元件、处理该查询元素以确定与接收到的结构化搜索查询相关联的一个或更多个命令数据元素类型,以及根据命令数据元素类型处理与定义的数据源相关联的数据以产生语义搜索查询结果数据集。
  • 异化数据库的通用方法、装置、电子设备及存储介质-202310797278.5
  • 吴继冰;黄宏斌;李璇;陈海文;张亮 - 中国人民解放军国防科技大学
  • 2023-06-30 - 2023-10-03 - G06F16/2452
  • 本发明提供一种异化数据库的通用方法、装置、电子设备及存储介质,包括:获取向目标数据库发送的第一结构化查询语句,第一结构化查询语句具有第一语法规则,目标数据库具有第二语法规则;对第一结构化查询语句进行语法解析,得到第一结构化查询语句的指令集;根据目标数据库的第二语法规则对指令集进行转换,得到第二结构化查询语句;存储目标数据库使用第二结构化查询语句得到的查询结果。本发明的有益效果为:通过对查询语句进行解析,并将解析结果通过规则文件转化为能够被异化数据库识别的查询语句,提高了异化数据库查询的便捷性;通过表达式、操作符及函数中的转换,提高了异化数据库的兼容性。
  • 一种改进的基于生成式大语言模型的NL2SQL方法-202311070932.9
  • 段春先;刘梦军;李颖;陈胜鹏;许继伟;雷振;刘高;李小超;王敬佩;付卓;韩小乐;夏帷;王锋 - 吉奥时空信息技术股份有限公司
  • 2023-08-24 - 2023-09-29 - G06F16/2452
  • 本发明适用于自然语言处理技术领域,提供一种改进的基于生成式大语言模型的NL2SQL方法,包括步骤S1、预处理数据库的表信息;步骤S2、自然语言问句预处理;步骤S3、目标表匹配;步骤S4、大语言模型结果输出;步骤S5、提取SQL语句并输出。本发明使用生成式大语言模型,利用思维链方式构建prompt语句去提升匹配精度,不需要端到端地重新训练,在数据库表结构频繁更新的实际生产环境中适用性更好。另外,本发明采取前置计算表、列加权得分的方式,解决实际生产环境中多表重复列干扰环境下的,数据库查询语义识别问题,该方法能够帮助大语言模型更好地理解和匹配自然语言问句中相关的表、列信息,提升最终结果的准确度。
  • 数据库操作语句生成方法、装置、计算机设备和存储介质-202310728695.4
  • 王立林;程冲;张永凯;高飞 - 中国工商银行股份有限公司
  • 2023-06-19 - 2023-09-15 - G06F16/2452
  • 本申请涉及一种数据库操作语句生成方法、装置、计算机设备、存储介质和计算机程序产品,涉及计算机技术领域,可用于金融科技领域或其他相关领域。所述方法包括:接收输入的用于操作数据库的自然语言信息;获取数据库中的数据结构信息,根据数据结构信息,确定数据库中与自然语言信息关联的关联数据表信息;数据结构信息用于表征数据库中的各个数据表的数据之间的依赖关系,以及,将自然语言信息转换为与数据库操作语言环境匹配的数据库语言信息;基于关联数据表信息和数据库语言信息,生成自然语言信息对应的数据库操作语句。采用本方法,能够提高数据库操作的操作效率。
  • 一种数据库查询语句的生成方法、装置、设备及存储介质-202310546133.8
  • 王飞;郑悦闻;李鹏飞;李青 - 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院
  • 2023-05-12 - 2023-09-12 - G06F16/2452
  • 本申请提供一种数据库查询语句的生成方法、装置、设备及存储介质。方法包括:利用命名实体识别模型对自然语言查询语句内的命名实体进行识别,得到嵌套型识别结果;将嵌套型识别结果中各个命名实体按照不同嵌套层级进行全组合;针对每一命名实体组合,基于数据库和结构化查询语言关键词对其中的各个命名实体进行语义匹配,得到各个命名实体的语义匹配结果及其置信度;对每一命名实体组合中的命名实体的置信度求平均,得到平均置信度最高的命名实体组合;按照数据库结构化查询语言的语法处理平均置信度最高的命名实体组合,得到对应自然语言查询语句的结构化查询语句。本申请能够解决生成的结构化查询语句不完整的问题,能够降低数据库使用门槛。
  • 一种基于关系感知注意力的中文查询生成SQL语句方法-202311018828.5
  • 张睿恒;曹哲;徐立新;刘雨蒙;赵怡婧;徐帆江 - 北京理工大学
  • 2023-08-14 - 2023-09-12 - G06F16/2452
  • 本发明涉及一种基于关系感知注意力的中文查询生成SQL语句方法,属于计算机自然语言处理和数据库查询语句生成技术领域。本发明在生成SQL语句时引入了SAT‑SQL模型框架,并将其应用在复杂中文语境下,使得生成的SQL语句更加准确地反映用户查询的意图,能够更好地理解中文查询的含义。在生成SQL语句时,还引入了基于MacBERT模型的编码策略,利用MacBERT模型的嵌入能力,在编码查询语句时更全面地考虑了单词之间的语义关联。通过引入语法检查机制,确保生成的SQL语句不存在语法错误。对比现有技术,本发明能够更好地解决中文查询到SQL语句的转换问题,在复杂中文查询生成SQL语句的效率、准确性和可读性方面都具有明显优势。
  • 一种基于病历后结构化处理的医疗信息推送方法-202310473971.7
  • 谭明智;杨涛;曲泽宁;王亮 - 百洋智能科技集团股份有限公司
  • 2023-04-27 - 2023-09-08 - G06F16/2452
  • 本发明提供的一种基于病历后结构化处理的医疗信息推送方法,包括:接收患者病历的图像文件,并对所述图像信息进行OCR文本识别,得到患者病历的文本信息。对所述文本信息执行基于NLP的结构化转换,并基于预设规则提取关键信息,生成结构化病历数据。利用所述结构化病历数据查询预定义数据库,确定相匹配的待推送信息,并向患者推送所述待推送信息。本发明改进了诊疗操作提供了数据支持,有助于提高医疗服务质量及患者安全管理。
  • 一种SQL语句的处理方法、装置、设备以及存储介质-202310736540.5
  • 刘宏令 - 金篆信科有限责任公司
  • 2023-06-20 - 2023-09-05 - G06F16/2452
  • 本发明公开了一种SQL语句的处理方法、装置、设备以及存储介质。该方法包括:若检测到客户端发出的待执行SQL语句,则确定所述待执行SQL语句所属的类型和唯一标识;所述类型为无参类型或有参类型。根据所述类型和唯一标识,在年轻代缓存区和/或老年代缓存区中进行查找,确定待执行SQL语句的目标SQL执行计划;调用执行器执行目标SQL执行计划,以生成执行结果,并将所述执行结果向客户端反馈。本发明的技术方案,SQL服务器在检测到待执行语句时,可以先从年轻代缓存区和/或老年代缓存区中确定对应的目标SQL执行计划,进一步通过执行目标SQL执行计划来执行待执行语句,避免了根据待执行语句重新生成执行计划执行的过程,提高了服务器对SQL语句的处理效率。
  • 一种交互式自然语言查询转换方法-201910129037.7
  • 王梅;陈德华;潘乔;李继云;王丽敏 - 东华大学
  • 2019-02-21 - 2023-09-01 - G06F16/2452
  • 本发明提供了一种交互式自然语言查询转换方法,包括以下步骤:语义解析;节点映射;模式匹配;预定义函数操作;查询交互;结果交互。本发明针对在面向大数据的应用中,非专业用户查询和使用数据库的困难性,以及自然语言在表达上的模糊性和抽象性与结构化查询语言的准确性和确定性存在的语义鸿沟,采用对用户输入的自然语言查询描述进行解析,建立其义原与数据库表与字段的对应关系,生成基础查询,并在此基础上添加函数操作以得到最终查询的方式,将传统自然语言查询接口和交互式查询结合,使得普通用户能通过自然语言描述的方式查询数据库,同时更好地捕捉用户查询意图。通过定义交互函数与结果反馈机制,提升复杂查询转换的准确度和高效性。
  • 基于flume异构数据的采集与标准化方法-202310440196.5
  • 王敏;程涛木;王可锋;蒋青松 - 博瑞得科技有限公司
  • 2023-04-23 - 2023-08-01 - G06F16/2452
  • 本发明涉及计算机网络技术领域,公开了基于flume异构数据的采集与标准化方法,包括:在flume配置文件中完成数据源的配置,根据数据本身的特征信息配置相应的连接信息与数据源插件;创建连接数据源和目标存储的数据流;对不同数据的类型分配对应的采集方式;对数据进行处理操作,通过自定义的拦截器实现;拦截器对json数组类数据做扁平化处理;通过配置获取解析规则,根据所述解析规则对数据提取有效字段值;通过配置获取字段和下游表字段的映射关系,方便下游存储。本发明提供的方法,使用flume内置的多种source,让采集系统具备很好的灵动性、灵活性,自定义拦截器,解决数据源数据因内容多样化而标准化数据的难题。
  • SQL注入攻击的检测方法、装置-202010507446.9
  • 王巍巍;陈功 - 北京奇艺世纪科技有限公司
  • 2020-06-05 - 2023-07-25 - G06F16/2452
  • 本发明实施例提供了一种SQL注入攻击的检测方法、装置,其中,所述方法包括:获取待检测的目标SQL语句;对所述目标SQL语句进行特征工程处理,得到所述目标SQL语句的特征数据;将所述特征数据输入预先训练完毕的SQL注入攻击检测模型中得到检测结果;若所述检测结果大于预设的概率阈值,则将所述目标SQL语句确定为SQL注入语句。本发明实施例利用训练完毕的SQL注入攻击检测模型确定目标SQL语句是否为SQL注入语句,可以解决现有的SQL注入攻击检测方案依赖于规则集或者固定的数据库的结构,需要人工参与,容易导致误报、漏报或失效的技术问题,提升了SQL注入攻击检测的效果。
  • 数据表的检索方法、装置、存储介质及电子设备-202310272045.3
  • 冯余剑;顾旦青;孙少杰;夏腾炜 - 中国工商银行股份有限公司
  • 2023-03-16 - 2023-07-21 - G06F16/2452
  • 本发明公开了一种数据表的检索方法、装置、存储介质及电子设备。涉及金融科技领域。其中,该方法包括:响应目标对象的数据查询请求,将数据查询请求的查询语料转化为文本向量;在目标检索库中检索文本向量,得到N个第一向量,其中,N为大于1的整数;基于文本向量与每个第一向量的相似度,确定查询结果,其中,查询结果至少包括:数据查询请求查询的数据表的数据表标识。本发明解决了相关技术中依据需要大量训练样本训练得到的分类模型查询用户需要查询的数据表,灵活性差的技术问题。
  • 语言转换模型训练、语言转换方法、装置、设备及介质-202110908451.5
  • 赵亮 - 平安科技(深圳)有限公司
  • 2021-08-09 - 2023-06-30 - G06F16/2452
  • 本发明实施例公开了一种语言转换模型训练、语言转换方法、装置、设备及介质,语言转换模型训练方法包括:获取所述编码模块输出的编码向量;将所述编码向量转换为不包括语义信息的零向量;将所述零向量作为译码模块预训练数据输入至所述译码模块;根据所述零向量将所述译码模块的原始语法树预训练更新至目标语法树。本发明实施例的技术方案能够提高语言转换模型的稳定性、训练效率和模型准确率,从而提高自然语言转换任务处理的准确率。
  • 数据查询方法、装置、存储介质及电子设备-202310274076.2
  • 冯余剑;顾旦青;孙少杰;夏腾炜 - 中国工商银行股份有限公司
  • 2023-03-20 - 2023-06-27 - G06F16/2452
  • 本发明公开了一种数据查询方法、装置、存储介质及电子设备。涉及人工智能技术领域。其中,该方法包括:接收目标对象的数据查询语句,其中,数据查询语句为与信贷业务相关的数据查询语句;若数据查询语句不是预设格式的查询语句,则判断数据查询语句的查询意图是否满足预设条件;在数据查询语句满足预设条件的情况下,将数据查询语句输入目标模型,输出第一查询语句,其中,目标模型用于将自然语言转化为结构化查询语言,第一查询语句的语言类型为结构化查询语言;执行第一查询语句,得到第一查询结果。本发明解决了相关技术中在信贷业务中,查数取数流程复杂,导致查数取数效率低的技术问题。
  • 语义关系数据库运算-201910332737.6
  • R.博尔达韦卡;O.什穆利 - 国际商业机器公司
  • 2019-04-24 - 2023-06-27 - G06F16/2452
  • 公开了一种方法、计算机程序产品和/或系统。根据本发明的一个方面,一个或多个处理器接收第一数据库的查询,其中该查询包括:(i)操作数,和(ii)指示基于距离的相似性度量的运算符。一个或多个处理器还基于所述查询确定结果集,其中所述结果集包括多个记录,并且其中基于(i)对应于所述操作数的第一向量,和(ii)对应于记录的第二向量之间的向量最近邻计算,将记录包括在所述结果集中,其中第二向量包括在基于第一数据库的文本表示的向量空间模型中。
  • 表格问答的控制方法、系统及存储介质-202310166255.4
  • 王永康 - 广东爱因智能科技有限公司
  • 2023-02-24 - 2023-06-23 - G06F16/2452
  • 本申请涉及一种表格问答的控制方法、系统及存储介质,利用已有问题‑sql,进行对抗生成的方案,利用一定收集的数据,产生大量可用的训练数据,特别是对于新表格,在无标注的情况下,生成训练数据,从而提升新表格冷启动的效果。采用本方法,当模型完成训练后,可以得到一个sql到问题的生成模型。对于新老表格,均可以使用此模型产生训练语料。特别是全新的表格,在没有训练语料的情况下,能够通过迭代的方式产生大量可用的训练语料。
  • 查询语句生成方法、数据查询方法及生成模型训练方法-202310096051.8
  • 惠彬原;李金阳;黄非;李永彬 - 阿里巴巴(中国)有限公司
  • 2023-01-18 - 2023-06-23 - G06F16/2452
  • 本说明书实施例提供查询语句生成方法、数据查询方法及生成模型训练方法,其中所述查询语句生成方法包括:接收查询请求;根据目标数据库标识,确定目标数据库的数据库模式;根据查询信息和数据库模式,构建查询结构关系图;将查询信息和查询结构关系图输入生成模型,获得查询信息对应的目标查询语句,其中,生成模型包括编码器和解码器,编码器用于对查询信息和查询结构关系图进行融合编码,解码器用于对融合编码特征解码得到目标查询语句。通过将查询结构关系图输入生成模型,在生成模型的编码器中对查询信息和查询结构关系图进行融合编码,有效地在编码器中注入结构信息,提高了生成模型的推理能力,准确生成目标查询语句。
  • 库间数据比对方法、其装置及电子设备-202211697599.X
  • 牛新庄;赵静;李时利;刘亚飞;徐慧斌 - 中国邮政储蓄银行股份有限公司
  • 2022-12-28 - 2023-06-23 - G06F16/2452
  • 本申请提供了一种库间数据比对方法、其装置及电子设备,该方法包括:首先,构建包括标准环境数据的标准库表;然后,采用预设比对范围清单从标准库表中提取出标准数据清单,且采用预设比对范围清单从多个生产环境库表中提取出生产数据清单,以得到标准数据清单以及多个生产环境对应的生产数据清单;最后,针对各生产环境库表,进行标准数据清单和生产数据清单之间的比对,得到比对结果。一方面,通过预设比对范围清单,实现了一次性比对多个生产环境库表与标准库表中的数据,另一方面,通过预设比对范围清单,避免了现有技术中利用客户端工具,通过人工干预进行比对,导致比对准确率较低的问题,保证了库间数据比对结果的准确性较高以及效率较高。
  • 消除数据库中空字符串和无效字符串差异的方法和装置-201911318802.6
  • 赵永光;朱晓洪;于秋波;宋喆;闫中敏;钱进;王可可 - 山大地纬软件股份有限公司
  • 2019-12-19 - 2023-06-23 - G06F16/2452
  • 本公开提供了一种消除数据库中空字符串和无效字符串差异的方法和装置,从数据库的数据字典中获取业务表中所有字符类型列;根据可信标志记录表校验业务表中所有字符类型列是否全部设置可信标志,如果是则结束步骤;如果不是,则对未设置可信标志的字符类型列数据进行全表扫描,检测空字符串是否存在;如果存在空字符串,将空字符串更新为无效字符串,否则设置业务表及相关视图中字符类型列的可信标志,记录到可信标志记录表中;从可信标志记录表中获取业务表的字符类型列的可信标志,根据字符类型列的可信标志对标准的数据库语句进行重新编译,得到数据库原生结构化查询语言。
  • 科研热点主题分析方法、装置与电子设备-201811374249.3
  • 高万林;何东彬;王敏娟;郝霞;张国锋;张莉;王兵兵;赵龙 - 中国农业大学
  • 2018-11-19 - 2023-06-13 - G06F16/2452
  • 本发明实施例提供一种科研热点主题分析方法、装置与电子设备,其中所述方法包括:建立基于科研文献的引用网络,并采用随机游走算法,计算每篇文档的文献排序权重,以过滤文献,获取引文数据和语料库;基于概率主题层次组合模型,对获取的所述引文数据和语料库进行评价筛选,获取热点科研主题。本发明实施例依据文献结构信息和主题所属信息构建主题演化图,并通过主题演化图,将主题描述优化、主题排序和主题演化结合起来,在提高时间效率的前提下获取更准确结果。
  • 一种中文数据库SQL语句生成方法、设备及存储介质-202010201202.8
  • 张汝宸;王玲;孔亚洲;朱德伟;朱峰;陈志宝;张超 - 华泰证券股份有限公司
  • 2020-03-20 - 2023-06-13 - G06F16/2452
  • 本发明公开了一种中文数据库SQL语句生成方法、设备及存储介质,包括如下步骤:根据任务种类,将SQL语句的构建拆解为若干子任务;利用语义表示模型对自然语言查询语句和待查询表列名进行语义编码后,分别针对各子任务进行有先后、有联合地预测;组合预测结果以生成所述SQL语句。本发明实施例提供的方法能够有效解决现有方案中存在的泛化性、扩展性、便捷性较差等技术问题。通过前后处理和深度学习模型的结合,实现了端到端的从自然语言语句到SQL语句的转换。同时,通过对SQL语句进行子任务的拆解,降低了模型预测的复杂度,提高了SQL语句生成的准确性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top