[发明专利]实体比较及模型训练方法、装置、设备、计算机存储介质在审

专利信息
申请号: 202110361949.4 申请日: 2021-04-02
公开(公告)号: CN113705235A 公开(公告)日: 2021-11-26
发明(设计)人: 杨石兵;徐也;沈卓;荆宁 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F16/35;G06F16/36
代理公司: 北京派特恩知识产权代理有限公司 11270 代理人: 王花丽;张颖玲
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 比较 模型 训练 方法 装置 设备 计算机 存储 介质
【说明书】:

本申请提供了一种实体比较及模型训练方法、装置、设备、计算机存储介质;其中,实体比较方法包括:分别获取待比较的第一实体和第二实体的属性信息以及类型信息;基于第一实体的属性信息和第二实体的属性信息,确定第一实体的各属性与第二实体的各属性之间的关联度分布特征;基于第一实体的类型信息和第二实体的类型信息,以及第一注意力分布参数,确定第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征;第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于关联度分布特征和重要度分布特征,确定第一实体与第二实体是否相同。本申请中,可以实现通用实体的比较任务,进而可提高实体消歧任务的迭代效率。

技术领域

本申请涉及但不限于人工智能领域,尤其涉及一种实体比较及模型训练方法、装置、设备、计算机可读存储介质。

背景技术

近些年来,随着知识图谱技术的发展,实体比较或实体匹配技术被大量用于知识图谱的构建中,旨在确认给定的两个实体是否为同一实体,若为同一实体则进行融合。相关技术中,在解决实体比较或实体匹配问题上,主要通过属性相似度聚合的方法,或先利用属性构建向量表示,再结合传统机器学习模型或深度学习模型对向量表示进一步编码,将实体比较任务作为一个分类问题来解决。但上述解决方案大多都是针对垂类实体或单一实体类型的比较任务,很难泛化到不同实体类型上,针对不同实体类型的场景,往往都需要进行单独模型的构建与训练,较为耗时,难以支持大量不同实体类型的实体消歧需求。

发明内容

本申请实施例提供一种实体比较及模型训练方法、装置、设备、计算机可读存储介质,能够实现通用实体的比较任务,进而可以提高实体消歧任务的迭代效率,还能在一定程度上提高实体比较的准确性,并且处理过程可解释。

本申请实施例的技术方案是这样实现的:

本申请实施例提供一种实体比较方法,包括:

分别获取待比较的第一实体和第二实体的属性信息以及类型信息;

基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;

基于所述第一实体的类型信息和所述第二实体的类型信息,以及第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;

基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同。

本申请实施例提供一种模型训练方法,用于对实体比较模型进行训练,训练得到的所述实体比较模型用于对内容服务中的实体对进行比较,包括:

获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;

将所述样本实体对输入至待训练的实体比较模型;所述实体比较模型用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;

基于所述预测结果和所述标注结果,对所述实体比较模型的参数进行调整,以得到已训练的实体比较模型。

本申请实施例提供一种实体比较装置,包括:

第一获取模块,用于分别获取待比较的第一实体和第二实体的属性信息以及类型信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110361949.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top