[发明专利]支持自然语言分析问题的分析处理系统在审
申请号: | 201911374595.6 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111382171A | 公开(公告)日: | 2020-07-07 |
发明(设计)人: | J·杨;M·瓦尔施内;M·奥布霍夫;S·尹 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/28 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 支持 自然语言 分析 问题 处理 系统 | ||
支持自然语言分析问题的在线分析处理系统。例如,在一个实施例中,一种计算机实现的方法包括:接收自然语言问题;确定该自然语言问题的意图;基于该自然语言问题的意图,基于该自然语言问题来预测度量查询语言语句;将该度量查询语言语句转换成结构化查询语言语句;引起结构化查询语言语句针对多维数据库数据的执行;以及基于结构化查询语言语句针对多维数据库数据的执行的结果,提供该自然语言问题的答案。
技术领域
所公开的实现总体上涉及在线分析处理(OLAP)计算机系统,其包括但不限于与这些系统的自然语言接口。
背景技术
世界上大量的数字信息被存储在结构化的数据库系统中,例如关系数据库系统。对该信息问问题并从该信息中获取答案(即,查询)通常需要具有结构化数据库查询语言的专业知识,例如结构化查询语言(SQL)。另外,为了表达出正确的结构化数据库查询语言语句,需要结构化数据库中信息的结构(架构)的领域特定的知识,例如包含感兴趣信息的表和列的名称。
随着在结构化数据库系统中存储的信息量的不断增长,希望查询该信息的用户数量也随之增长。这些用户中的许多人,包括数据分析师和商业智能分析师,都不是结构化数据库系统或结构化数据库查询语言的专家——也不希望成为结构化数据库系统或结构化数据库查询语言的专家。理论上讲,可以开发到结构化数据库系统的自然语言接口,其允许用户使用自然语言查询语言更加自然地查询存储在结构化数据库系统中的信息,通过该自然语言查询语言,用户可以提出关于信息的问题,而无需精通结构化数据库查询语言。
过去已经研究了根据自然语言问题来构造结构化查询语言(SQL)语句的问题。早期的工作集中在使用最大流图匹配方法来为语义上易处理的问题构造SQL语句。最大流图匹配方法的局限性在于它在回答非语义上易处理的自然语言问题(例如,包含预定词典中缺少的词语的自然语言问题)方面的缺陷。
最近,已经提出了基于机器学习神经网络的方法。利用这些方法,自然语言问题和SQL语句被视为序列,并且序列到序列模型被训练并用作解析器。这些方法的一个问题是,由于可交换性和关联性,不同的SQL语句可能彼此等同。结果,谓语从句(例如,SQL语句中的WHERE从句)中的约束顺序可能会对序列到序列模型的性能产生负面影响,这是因为确定约束的最佳排序是困难的。缓解此排序问题的一种方法是将增强学习应用于序列到序列模型中。其他可能的缓解方法包括使用基于SQL草图的方法,该方法采用序列到集合的模型。不幸的是,基于SQL草图的方法通常受到以下限制:只能构造非常基本的SQL语句,例如SELECT-FROM-WHERE形式的SQL语句。
在本文中公开的计算机实现的技术解决了这些问题和其他问题。
本节中描述的方法是可以采用的方法,但不一定是先前已经设想或采用的方法。因此,除非另有说明,否则不应仅由于将本节中所述的任何方法包括在本节中而将其假定为现有技术。
发明内容
所附权利要求可以充当本发明的一些实现的有用概要。
附图说明
为了更好地理解所描述的各种实现,应当结合以下附图参考以下对实现的描述,其中,在整个附图中,相同的附图标记指代对应的部分。
图1示出了根据一些实现的示例计算机系统。
图2示出了根据一些实现的示例自然语言接口系统。
图3示出了根据一些实现的槽(slot)预测任务。
图4是根据一些实现的用于槽预测的高级方法的流程图。
图5示出了根据一些实现的用于训练度量(metric)模型的方法。
图6示出了根据一些实现的用于训练细分模型的方法。
图7示出了根据一些实现的用于训练过滤器模型的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911374595.6/2.html,转载请声明来源钻瓜专利网。