[发明专利]知识图谱消歧方法、装置、设备及存储介质有效
申请号: | 202110851340.5 | 申请日: | 2018-01-25 |
公开(公告)号: | CN113641707B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 方舟;冯知凡;陆超;张扬;朱勇;李莹;徐也;王述 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458;G06F16/28 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 方法 装置 设备 存储 介质 | ||
本发明公开了知识图谱消歧方法、装置、设备及存储介质,其中方法包括:针对待处理的SPO,从知识库中拉取候选实体;分别获取各候选实体对应的预定特征;根据获取到的预定特征对各候选实体进行排序,选出排序后处于第一位的候选实体;将待处理的SPO中的O关联到选出的候选实体上。应用本发明所述方案,能够提高建边结果的准确性等。
【技术领域】
本发明涉及计算机应用技术,特别涉及基于人工智能的实体建边方法、装置、设备及存储介质。
【背景技术】
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
在构建海量知识库的过程中,实体建边是极为重要的部分,可丰富知识图谱边关系,提高知识图谱连通度,还能够辅助知识理解等。在应用上可以支持搜索场景的关系推理,还可以支持展示实体卡片之间的关联关系等。
结构化实体,是大量主谓宾三元组(SPO)的集合,S即subject,P即predict,O即object。实体建边是指对SPO中的O进行实体消歧,在知识库中找到对应的相同概念的实体。
现有技术中提出了各种实体建边方式,如比较常用的有:通过机器学习方法将知识库中的实体与关系都转化为向量表达,向量之间的距离表示了实体与实体、实体与关系之间的联系等,但这种方式需要对所有实体与属性进行训练,训练时间较长,处理效率低下。
【发明内容】
有鉴于此,本发明提供了基于人工智能的实体建边方法、装置、设备及存储介质。
具体技术方案如下:
一种基于人工智能的实体建边方法,包括:
针对待处理的主谓宾三元组SPO,从知识库中拉取候选实体;
分别获取各候选实体对应的预定特征;
根据所述预定特征对各候选实体进行排序,选出排序后处于第一位的候选实体;
将所述待处理的SPO中的O关联到选出的候选实体上。
根据本发明一优选实施例,所述从知识库中拉取候选实体包括:
基于多维分区技术,从知识库中拉取候选实体。
根据本发明一优选实施例,所述多维分区技术包括:
基于schema分区、基于语义边关系分区、基于语义实体向量聚类分区以及基于模糊检索分区。
根据本发明一优选实施例,所述分别获取各候选实体对应的预定特征包括:
针对每个候选实体,分别获取所述候选实体对应的对特征pair_features以及组特征group_features;
所述pair_features为衡量所述待处理的SPO与所述候选实体之间的相似性的特征;
所述group_features为衡量包括所述待处理的SPO在内的一组SPO与所述候选实体之间的相似性的特征,所述一组SPO为从所述待处理的SPO所在的实体中抽取出的全部或部分SPO。
根据本发明一优选实施例,所述根据所述预定特征对各候选实体进行排序包括:
根据所述预定特征,利用排序模型对各候选实体进行排序。
根据本发明一优选实施例,该方法进一步包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110851340.5/2.html,转载请声明来源钻瓜专利网。