[发明专利]使用结构化和非结构化数据的解析查询在审
| 申请号: | 202080062121.2 | 申请日: | 2020-08-21 | 
| 公开(公告)号: | CN114391142A | 公开(公告)日: | 2022-04-22 | 
| 发明(设计)人: | 钱坤;李蕴瑶;N.布塔尼 | 申请(专利权)人: | 国际商业机器公司 | 
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/38 | 
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 | 
| 地址: | 美国纽*** | 国省代码: | 暂无信息 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 使用 结构 数据 解析 查询 | ||
一种计算机实现的方法包括:以自然语言格式接收问题;从问题导出多个子查询;确定多个子查询中的第一子查询不能利用策划的知识库来解析;利用非结构化文本解析第一子查询;以及利用解析的第一子查询调整策划的知识库。
技术领域
本发明一般地涉及数据分析,并且更具体地涉及利用索引的非结构化数据和策划的知识库(curated knowledge base)的组合来解析(resolve)查询。
背景技术
知识库(KB)经常用于许多以数据为中心的应用,例如问题回答(QA)应用。这样的知识库是利用策划的非结构化文本来创建的,并且基于高精度知识来提供准确的回答。然而,虽然知识库为特定信息子集提供准确的结果,但是它们不能提供对该特定子集之外的查询的回答。
发明内容
根据一个方面的计算机实现的方法包括以自然语言格式接收问题;从问题导出多个子查询;确定多个子查询中的第一子查询不能利用策划的知识库来解析;利用非结构化文本解析第一子查询;以及利用解析的第一子查询调整策划的知识库。
根据另一方面,一种用于使用结构化和非结构化数据来解析查询的计算机程序产品包括具有随其体现的程序指令的计算机可读存储介质,其中计算机可读存储介质本身不是暂时性信号,并且其中程序指令可由处理器执行以使处理器执行方法,该方法包括由处理器以自然语言格式接收问题;由处理器从问题导出多个子查询;由处理器确定多个子查询中的第一子查询不能利用策划的知识库来解析;由处理器利用非结构化文本解析第一子查询;以及由处理器利用解析的第一子查询调整策划的知识库。
根据另一方面,一种系统包括处理器;以及与处理器集成、可由处理器执行、或者与处理器集成并可由处理器集成的逻辑,其中逻辑被配置为以自然语言格式接收问题;从问题导出多个子查询;确定多个子查询中的第一子查询不能利用策划的知识库来解析;利用非结构化文本解析第一子查询;以及利用解析的第一子查询调整策划的知识库。
根据另一方面,一种计算机实现的方法包括以自然语言格式接收问题;从问题导出第一子查询和第二子查询;确定第一子查询不能利用基于非结构化文本的策划的知识库来解析;利用查询放宽为第一子查询创建附加搜索项;利用第一子查询和附加搜索项查询针对非结构化文本的搜索索引;响应于搜索索引的查询,接收搜索结果;基于搜索结果创建新的主语/谓语/宾语三元组;利用新的主语/谓语/宾语三元组完成第一子查询;更新策划的知识库以包括完成的第一子查询;确定第二子查询能够利用更新的策划的知识库来解析;以及利用更新的策划的知识库完成第二子查询。
根据又一方面,一种用于实现按需提取和集成的计算机程序产品包括计算机可读存储介质,该计算机可读存储介质具有随其体现的程序指令,其中该计算机可读存储介质本身不是暂时性信号,并且其中该程序指令可由处理器执行以使该处理器执行方法,该方法包括由处理器以自然语言格式接收问题;由处理器从问题导出第一子查询和第二子查询;由处理器确定第一子查询不能利用基于非结构化文本的策划的知识库来解析;由处理器利用查询放宽为第一子查询创建附加搜索项;由处理器利用第一子查询和附加搜索项来查询针对非结构化文本的搜索索引;由处理器响应于搜索索引的查询,接收搜索结果;由处理器基于搜索结果创建新的主语/谓语/宾语三元组;由处理器利用新的主语/谓语/宾语三元组完成第一子查询;由处理器更新策划的知识库以包括完成的第一子查询;由处理器确定第二子查询能够利用更新的策划的知识库来解析;以及由处理器利用更新的策划的知识库来完成第二子查询。
从以下详细描述中,本发明的其它方面和实施例将变得显而易见,当结合附图时,以下详细描述通过示例的方式示出了本发明的原理。
附图说明
图1示出了根据本发明一个实施例的网络架构。
图2示出了根据本发明的一个实施例的可以与图1的服务器和/或客户端相关联的代表性硬件环境。
图3示出根据本发明一个实施例的使用结构化和非结构化数据解析查询的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080062121.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





