[发明专利]实体对齐方法、装置、电子设备和存储介质在审
申请号: | 202111006095.4 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113704495A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 李直旭;马桂林;邓宸博;陈嘉 | 申请(专利权)人: | 合肥智能语音创新发展有限公司;科大讯飞(苏州)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230094 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 对齐 方法 装置 电子设备 存储 介质 | ||
本发明提供一种实体对齐方法、装置、电子设备和存储介质,其中方法包括:确定待对齐的两个目标实体;确定两个目标实体的邻居差异信息,所述邻居差异信息为对应目标实体的邻居信息与另一目标实体的邻居信息之间的差异;基于两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果。本发明利用邻居差异信息来弥补知识图谱异构性带来的短期邻居差异,减弱短期邻居差异给两个目标实体的实体表示带来的干扰,从而确定两个目标实体间的实体对齐结果,提高了实体对齐的准确性。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种实体对齐方法、装置、电子设备和存储介质。
背景技术
自然语言处理技术的发展,使得知识图谱在信息搜索、智能问答和推荐系统等领域崭露头角。对于搜索问答等上游任务而言,知识图谱所涵盖的知识量是高准确率的前提,而随着时间推移,知识图谱的数量增多、种类也愈加繁琐。因此,需要将来自不同知识图谱的实体进行对齐,将多个知识图谱融合,实现不同场景与领域的知识共享。
然而,目前的实体对齐方法均以实体与其在不同图谱中对应的实体具有相似的邻域结构作为前提,而现实场景中的知识图谱多具备不完整性和异质性,由此带来的邻域差异会影响实体对齐的准确性。
发明内容
本发明提供一种实体对齐方法、装置、电子设备和存储介质,用以解决现有技术中准确性欠佳的缺陷。
本发明提供一种实体对齐方法,包括:
确定待对齐的两个目标实体;
确定所述两个目标实体的邻居差异信息,所述邻居差异信息为对应目标实体的邻居信息与另一目标实体的邻居信息之间的差异;
基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果。
根据本发明提供的一种实体对齐方法,所述确定所述两个目标实体的邻居差异信息,包括:
对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到所述两个目标实体的邻居差异信息,任一目标实体的邻居差异信息包括所述任一目标实体的各个邻居实体与另一目标实体的各个邻居实体之间的差异。
根据本发明提供的一种实体对齐方法,所述对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到所述两个目标实体间的邻居差异信息,包括:
对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到任一目标实体的各个邻居实体与另一目标实体的各个邻居实体间的匹配度;
基于任一目标实体的任一邻居实体与另一目标实体的各个邻居实体间的匹配度,对所述另一目标实体的各个邻居实体的实体信息进行融合,得到所述任一目标实体的所述任一邻居实体的邻居融合信息;
确定所述任一目标实体的各个邻居实体的实体信息与对应邻居融合信息之间的差异,作为所述任一目标实体的邻居差异信息。
根据本发明提供的一种实体对齐方法,所述基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果,包括:
基于任一目标实体的各个邻居实体与另一目标实体的各个邻居实体之间的差异,以及所述任一目标实体的各个邻居实体的实体信息,确定所述任一目标实体的各个邻居实体的邻居表示;
将任一目标实体的实体信息与其各个邻居实体的邻居表示融合,得到所述任一目标实体的实体结构信息;
基于所述两个目标实体的实体结构信息,确定所述两个目标实体间的实体对齐结果。
根据本发明提供的一种实体对齐方法,所述将任一目标实体的实体信息与其各个邻居实体的邻居表示融合,得到所述任一目标实体的实体结构信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥智能语音创新发展有限公司;科大讯飞(苏州)科技有限公司,未经合肥智能语音创新发展有限公司;科大讯飞(苏州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111006095.4/2.html,转载请声明来源钻瓜专利网。