[发明专利]基于知识图谱的搜索方法及装置有效
申请号: | 201611209246.5 | 申请日: | 2016-12-23 |
公开(公告)号: | CN108241649B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 易勋;陈进平 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 搜索 方法 装置 | ||
本发明提供了一种基于知识图谱的搜索方法及装置,该方法包括:选取知识图谱的词条中的至少一个谓词;收集与各谓词匹配的自然语言问句,并在各谓词与其匹配的自然语言问句之间建立映射关系;当接收到来自用户的查询问句时,在所述映射关系中将所述查询问句与自然语言问句进行匹配,得到匹配的自然语言问句对应的目标谓词;基于所述查询问句与所述目标谓词,生成满足所述知识图谱的词条格式的查询语句;利用生成的所述查询语句查找所述知识图谱的词条,将查找得到的查询结果作为问答结果提供给所述用户。本发明实施例能够在用户口语化的表达的情况下提供准确的查询结果,从而提升用户的搜索体验。
技术领域
本发明涉及信息搜索技术领域,特别是一种基于知识图谱的搜索方法及装置。
背景技术
知识图谱旨在描述真实世界中存在的各种实体或概念,每个实体或概念用一个全局唯一确定的ID(IDentity,身份标识号)来标识。知识图谱可以被看作是一张巨大的网状图,网状图中的节点表示实体或概念,而网状图中的边则由属性或关系构成。知识图谱主要就是构建和维护上述的实体和关系,为搜索中的推荐系统、语义理解、问题回答等提供支持。
知识图谱的词条中有很多规范的谓词以及对应的值,例如,“刘德华出生日期1961年9月27日”,然而,用户的查询常常是口语化的,如“刘德华多高”,“刘德华在哪儿出生的”,“刘德华生日是哪天”等等,那么如何根据用户口语化的表达来提供准确的查询结果成为亟需解决的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于知识图谱的搜索方法及相应的装置。
依据本发明的一方面,提供了一种基于知识图谱的搜索方法,包括:
选取知识图谱的词条中的至少一个谓词;
收集与各谓词匹配的自然语言问句,并在各谓词与其匹配的自然语言问句之间建立映射关系;
当接收到来自用户的查询问句时,在所述映射关系中将所述查询问句与自然语言问句进行匹配,得到匹配的自然语言问句对应的目标谓词;
基于所述查询问句与所述目标谓词,生成满足所述知识图谱的词条格式的查询语句;
利用生成的所述查询语句查找所述知识图谱的词条,将查找得到的查询结果作为问答结果提供给所述用户。
可选地,所述收集与各谓词匹配的自然语言问句,包括:
构造各谓词对应的问句,并基于构造的问句将所述知识图谱中包含该谓词的词条转化为搜索问句;
将所述搜索问句作为搜索query,在搜索引擎中进行搜索,得到所述搜索问句对应的一个或多个问答类结果;
基于所述一个或多个问答类结果确定与该谓词匹配的自然语言问句。
可选地,基于构造的问句将所述知识图谱中包含该谓词的词条转化为搜索问句,包括:
获取所述知识图谱中包含该谓词的词条,并截取词条中包含主语词和谓词的部分;
将截取的部分中的谓词替换为所述构造的问句,得到搜索问句。
可选地,基于所述一个或多个问答类结果确定与该谓词匹配的自然语言问句,包括:
从所述一个或多个问答类结果中提取问题项,并将其作为与该谓词匹配的自然语言问句。
可选地,基于所述一个或多个问答类结果确定与该谓词匹配的自然语言问句,包括:
从所述一个或多个问答类结果中提取问题项,并将其作为与所述搜索问句相关的候选query;
从所述候选query中筛选出一个或多个问题项,作为与该谓词匹配的自然语言问句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611209246.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:训练分类标准的训练方法和装置