[发明专利]基于知识图谱的搜索方法及装置有效
申请号: | 201611209246.5 | 申请日: | 2016-12-23 |
公开(公告)号: | CN108241649B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 易勋;陈进平 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 搜索 方法 装置 | ||
1.一种基于知识图谱的搜索方法,包括:
选取知识图谱的词条中的至少一个谓词;
收集与各谓词匹配的自然语言问句,并在各谓词与其匹配的自然语言问句之间建立映射关系;
当接收到来自用户的查询问句时,在所述映射关系中将所述查询问句与自然语言问句进行匹配,得到匹配的自然语言问句对应的目标谓词;
基于所述查询问句与所述目标谓词,生成满足所述知识图谱的词条格式的查询语句;
利用生成的所述查询语句查找所述知识图谱的词条,将查找得到的查询结果作为问答结果提供给所述用户;
其中,所述收集与各谓词匹配的自然语言问句,包括:
构造各谓词对应的问句,并基于构造的问句将所述知识图谱中包含该谓词的词条转化为搜索问句;
将所述搜索问句作为搜索query,在搜索引擎中进行搜索,得到所述搜索问句对应的一个或多个问答类结果;
基于所述一个或多个问答类结果确定与该谓词匹配的自然语言问句;
基于构造的问句将所述知识图谱中包含该谓词的词条转化为搜索问句,包括:
获取所述知识图谱中包含该谓词的词条,并截取词条中包含主语词和谓词的部分;
将截取的部分中的谓词替换为所述构造的问句,得到搜索问句。
2.根据权利要求1所述的方法,其中,基于所述一个或多个问答类结果确定与该谓词匹配的自然语言问句,包括:
从所述一个或多个问答类结果中提取问题项,并将其作为与该谓词匹配的自然语言问句。
3.根据权利要求1所述的方法,其中,基于所述一个或多个问答类结果确定与该谓词匹配的自然语言问句,包括:
从所述一个或多个问答类结果中提取问题项,并将其作为与所述搜索问句相关的候选query;
从所述候选query中筛选出一个或多个问题项,作为与该谓词匹配的自然语言问句。
4.根据权利要求3所述的方法,其中,从所述候选query中筛选出一个或多个问题项,作为与该谓词匹配的自然语言问句,包括:
对所述候选query中的各个问题项与该谓词的对应关系做置信度打分;
根据打分值,从所述候选query中筛选出一个或多个问题项,作为与该谓词匹配的自然语言问句。
5.根据权利要求4所述的方法,其中,对所述候选query中的各个问题项与该谓词的对应关系做置信度打分,包括:
获取人工标注的query与该谓词的对应关系;
根据获取的人工标注的query与该谓词的对应关系生成训练数据;
利用所述训练数据对指定分类器模型进行训练,确定所述指定分类器模型中的参数;
将所述候选query中的各个问题项输入所述指定分类器模型,以由所述指定分类器模型对所述候选query中的各个问题项与该谓词的对应关系做置信度打分。
6.根据权利要求1-5中任一项所述的方法,其中,若所述目标谓词包括多个;
基于所述查询问句与所述目标谓词,生成满足所述知识图谱的词条格式的查询语句,包括:
获取各个目标谓词对应的打分值,选取打分值最高的目标谓词;
基于所述查询问句与所述打分值最高的目标谓词,生成满足所述知识图谱的词条格式的查询语句。
7.根据权利要求1-5中任一项所述的方法,其中,在收集与各谓词匹配的自然语言问句之后,所述方法还包括:
根据收集的与各谓词匹配的自然语言问句,计算两两谓词之间的相似度;
将计算的相似度大于指定阈值的两两谓词作为同义词谓词。
8.根据权利要求1-5中任一项所述的方法,其中,在所述映射关系中将所述查询问句与自然语言问句进行匹配,得到匹配的自然语言问句对应的目标谓词之后,所述方法还包括:
判断是否存在所述目标谓词的同义词谓词;
若存在,则基于所述查询问句与所述目标谓词的同义词谓词,生成满足所述知识图谱的词条格式的查询语句;
利用生成的所述查询语句查找所述知识图谱的词条,将查找得到的查询结果作为问答结果提供给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611209246.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:训练分类标准的训练方法和装置