[发明专利]将文本转化为结构化查询语言的方法及装置有效
申请号: | 202011502186.2 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112487135B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 俞凯;陈志 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 转化 结构 查询 语言 方法 装置 | ||
本发明公开一种将文本转化为结构化查询语言的方法,包括:根据用户问句文本和相应的数据库信息确定抽象问句表示和抽象数据库信息表示;将抽象问句表示和抽象数据库信息表示输入至第一转换器,以得到统一信息表示;确定统一信息表示所对应的语法树结构,以得到对应于用户问句文本的结构化查询语言。本发明借用数据库中既有领域信息又有结构信息的特点,采用图投影模型分离领域信息。我们将数据库的语义信息作为跳板,利用数据库的结构信息来更新问句,逐步抽象化问句的表示,使得问句和数据库中的领域信息逐渐剥离,最后得到抽象化的问句和数据库的表示,这种表示不包含具体的语义信息,通过这种方式来提升模型的领域迁移能力。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种将文本转化为结构化查询语言的方法及装置。
背景技术
文本到SQL(Structured Query Language)语句任务的目的在于将自然语言问句转化为对应的可执行SQL语句。传统的文本到SQL方式有基于中间表示的文本到SQL(结构化查询语言)解析网络(IRNet)和基于关系可知transformer的文本到SQL模型(RATSQL)。
IRNet:针对可执行的SQL语句用抽象语法树技术设计一套中间语法,所有的SQL语句都可以用这套语法来表示。相比较于SQL语句,中间语法会抽象表示SQL中的关键词,会使得搜索空间大大减小。在解析的时候只需要先解析出搜索空间较小的中间语法,然后再将中间语法还原成SQL语句。
RATSQL:关系可知transformer的文本到SQL模型将数据库信息和用户问句信息拼在一起,并且充分考虑它们之间的关系,将关系信息融入到问句和数据库信息的表示之中。这种统一表示方式在领域迁移任务中取得到了比较好的效果。
但是上面介绍的两个方法都没有地考虑领域信息对文本到SQL语句解析任务带来的影响,然而对于文本到SQL语句解析任务领域迁移的能力具有很重要的现实意义。领域信息对性能的影响也需要得到重视,如何消除这一影响在之前的方法中都没有得到解决。
发明内容
本发明实施例提供一种将文本转化为结构化查询语言的方法及装置,用于至少解决上述技术问句之一。
第一方面,本发明实施例提供一种将文本转化为结构化查询语言的方法,包括:
根据用户问句文本和相应的数据库信息确定抽象问句表示和抽象数据库信息表示;
将所述抽象问句表示和抽象数据库信息表示输入至第一转换器,以得到统一信息表示;
确定所述统一信息表示所对应的语法树结构,以得到对应于所述用户问句文本的结构化查询语言。
第二方面,本发明实施例提供一种将文本转化为结构化查询语言的装置,包括:
投影层程序模块,用于根据用户问句文本和相应的数据库信息确定抽象问句表示和抽象数据库信息表示;
第一转换器程序模块,用于将所述抽象问句表示和抽象数据库信息表示输入至第一转换器,以得到统一信息表示;
解码器程序模块,用于确定所述统一信息表示所对应的语法树结构,以得到对应于所述用户问句文本的结构化查询语言。
第三方面,本发明实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项将文本转化为结构化查询语言的方法。
第四方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明上述任一项将文本转化为结构化查询语言的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011502186.2/2.html,转载请声明来源钻瓜专利网。