[发明专利]问答查询方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202210365261.8 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114942981A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 韩红旗;丁楷;李琳娜;张运良;王力 | 申请(专利权)人: | 中国科学技术信息研究所 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/295;G06F40/35;G06K9/62 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 100038*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 查询 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种问答查询方法,其特征在于,包括:
获取待查询的问句;
基于预训练的目标分类器对所述问句进行句型分类,得到句型类别;其中,所述句型类别表征所述问句中命名实体和实体关系的数量信息;
基于所述数量信息对所述问句进行解析,生成所述问句对应的目标查询语句;
基于预设的知识图谱查询与所述目标查询语句对应的答句。
2.根据权利要求1所述的方法,其特征在于,所述目标分类器包括第一分类器和第二分类器;
所述基于预训练的目标分类器对所述问句进行句型分类,得到句型类别,包括:
根据所述第一分类器对所述问句进行句型分类,得到句型分类结果;
基于所述第二分类器对所述句型分类结果进行融合处理,得到句型类别。
3.根据权利要求2所述的方法,其特征在于,所述第一分类器包括至少两个目标分类单元;
所述根据所述第一分类器对所述问句进行句型分类,得到句型分类结果,包括:
分别基于每个所述目标分类单元对所述问句进行句型分类,得到至少两个分类信息,将所述分类信息作为所述句型分类结果。
4.根据权利要求3所述的方法,其特征在于,所述第一分类器包括三个目标分类单元;
所述目标分类器是基于如下方式训练得到的:
将预设第一训练集均分为三个子训练集;每一所述子训练集对应一初始分类单元;
将所述子训练集分别输入对应的初始分类单元,对所述初始分类单元进行训练,得到目标分类单元;
基于所述初始分类单元在训练过程中生成的预测数据得到第二训练集;
基于所述第二训练集对融合分类器进行训练,得到所述目标分类器;其中,所述融合分类器包括所述目标分类单元与预设初始分类器。
5.根据权利要求1所述的方法,其特征在于,所述基于所述数量信息对所述问句进行解析,生成所述问句对应的目标查询语句,包括:
识别所述问句中的命名实体;
抽取所述问句中的目标关系名;
基于所述命名实体、所述目标关系名和所述数量信息,将所述问句转换为目标查询语句。
6.根据权利要求5所述的方法,其特征在于,所述抽取所述问句中的目标关系名,包括:
获取至少两个候选关系名;
将所述问句与每一所述候选关系名进行组合,生成融合信息;
对所述融合信息进行语义分析,确定所述目标关系名。
7.根据权利要求6所述的方法,其特征在于,所述对所述融合信息进行语义分析,确定所述目标关系名,包括:
确定所述融合信息的语义特征向量;
基于所述语义特征向量,从至少两个所述融合信息中确定目标融合信息;
将所述目标融合信息对应的候选关系名,作为所述目标关系名。
8.一种问答查询装置,其特征在于,包括:
第一获取模块,用于获取待查询的问句;
分类模块,用于基于预训练的目标分类器对所述问句进行句型分类,得到句型类别;其中,所述句型类别表征所述问句中命名实体和实体关系的数量信息;
解析模块,用于基于所述数量信息对所述问句进行解析,生成所述问句对应的目标查询语句;
第二获取模块,用于基于预设的知识图谱查询与所述目标查询语句对应的答句。
9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术信息研究所,未经中国科学技术信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210365261.8/1.html,转载请声明来源钻瓜专利网。