[发明专利]一种自然语言至结构化查询语言的转换方法及系统有效
申请号: | 202010491307.1 | 申请日: | 2020-06-02 |
公开(公告)号: | CN111651474B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 徐驰;罗明宇;林健 | 申请(专利权)人: | 东云睿连(武汉)计算技术有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2452;G06F18/22 |
代理公司: | 武汉智正诚专利代理事务所(普通合伙) 42278 | 代理人: | 李卫 |
地址: | 430000 湖北省武汉市东湖新技术开发区金融*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然语言 结构 查询 语言 转换 方法 系统 | ||
本申请实施例公开了一种自然语言至结构化查询语言的转换方法及系统,该方法包括:获取用户输入的自然语言问题文本;根据所述输入的自然语言问题文本与预设数据集中自然语言问题的相似度,确定将所述输入的自然语言问题文本转换为结构化查询语言的转换结果;若所述预设数据集中不存在目标自然语言问题,则通过转换算法模型将所述输入的自然语言问题文本转换为结构化查询语言。采用本申请实施例,能够降低结构化数据库的访问门槛,方便非技术人员直接查询使用结构化数据库。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种自然语言至结构化查询语言的转换方法及系统。
背景技术
近年来深度学习行业发展迅速,深度学习技术不仅在计算机视觉、语音识别、自动驾驶等领域取得了令人瞩目的进步,而且在自然语言处理(Natural LanguageProcessing,NLP)领域也有长足的发展。深度学习中的神经网络模型在自然语言处理领域中诸如命名实体识别、词性标注、情感分析、阅读理解、机器翻译等任务中的表现已经全面超越了传统方法。
在信息技术高速发展的今天,每天都会产生大量的数据,并保存在各式各样的数据库中。通常,查询数据库中的数据需要通过结构化查询语言(SQL)这样的程序式查询语言来进行交互。但是对于许多非专业人员来说,掌握SQL语言存在一定的技术门槛。为了让非专业用户也能按需查询数据库,如何通过自然语言查询数据库中的目标数据成为了新兴的研究热点。
现有的类似工作大多是基于传统的语言规则或模板匹配的方式,算法的泛化性和灵活性有一定的局限。
发明内容
本申请实施例公开了一种自然语言至结构化查询语言的转换方法及系统,能降低结构化数据库的访问门槛,方便非技术人员直接查询使用结构化数据库。
第一方面,本申请实施例提供了一种自然语言至结构化查询语言的转换方法,该方法包括:
获取用户输入的自然语言问题文本;
根据所述输入的自然语言问题文本与预设数据集中自然语言问题的相似度,确定将所述输入的自然语言问题文本转换为结构化查询语言的转换结果,其中,所述预设数据集中包含自然语言问题与对应的结构化查询语言;
若所述预设数据集中不存在目标自然语言问题,则通过转换算法模型将所述输入的自然语言问题文本转换为结构化查询语言,其中,所述目标自然语言问题为所述预设数据集中与所述输入的自然语言问题文本的相似度最高的一个自然语言问题,且所述输入的自然语言问题文本与所述目标自然语言问题的相似度大于相似度阈值,所述转换算法模型为基于深度学习算法模型进行模型训练得到的。
在上述方法中,能够降低结构化数据库的访问门槛,方便非技术人员直接查询使用结构化数据库,与传统的基于语言规则或模板匹配的算法相比,基于深度学习的算法灵活性和泛化性更具优势。
结合第一方面,在一种可能的实施方式中,所述根据所述输入的自然语言问题文本与预设数据集中自然语言问题的相似度,确定将所述输入的自然语言问题文本转换为结构化查询语言的转换结果之后,还包括:
若所述预设数据集中存在所述目标自然语言问题,则将所述自然语言问题文本转换为与所述目标自然语言问题对应的结构化查询语言。
结合第一方面,在一种可能的实施方式中,所述根据所述输入的自然语言问题文本与预设数据集中自然语言问题的相似度,确定将所述输入的自然语言问题文本转换为结构化查询语言的转换结果之前,还包括:
选择预设场景下的数据库作为样本数据库,其中,所述样本数据库中包含自然语言问题与对应的结构化查询语言;
采集针对所述样本数据库中自然语言问题与对应的结构化查询语言的数据集映射,作为所述预设数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东云睿连(武汉)计算技术有限公司,未经东云睿连(武汉)计算技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010491307.1/2.html,转载请声明来源钻瓜专利网。