[发明专利]实体比较及模型训练方法、装置、设备、计算机存储介质在审
申请号: | 202110361949.4 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113705235A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 杨石兵;徐也;沈卓;荆宁 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06F16/36 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王花丽;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 比较 模型 训练 方法 装置 设备 计算机 存储 介质 | ||
1.一种实体比较方法,其特征在于,包括:
分别获取待比较的第一实体和第二实体的属性信息以及类型信息;
基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;
基于所述第一实体的类型信息和所述第二实体的类型信息,以及第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;
基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同。
2.根据权利要求1所述的方法,其特征在于,所述基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同,包括:
对所述关联度分布特征和所述重要度分布特征进行特征融合处理,得到所述第一实体的各属性与所述第二实体的各属性之间的重要关联度分布特征;
对所述重要关联度分布特征进行分类处理,得到表征所述第一实体与所述第二实体是否相同的分类结果;
基于所述分类结果,确定所述第一实体与所述第二实体是否相同。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征,包括:
基于所述第一实体的属性信息和所述第二实体的属性信息,以及第二注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;所述第二注意力分布参数表征所述第一实体的各属性与所述第二实体的各属性之间可比性的注意力分布情况。
4.根据权利要求3所述的方法,其特征在于,所述关联度分布特征包括所述第一实体的每一属性与所述第二实体的每一属性之间的关联度,所述基于所述第一实体的属性信息和所述第二实体的属性信息,以及第二注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征,包括:
基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的每一属性和所述第二实体的每一属性;
针对所述第一实体的每一属性,基于所述第二注意力分布参数,确定所述属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度;
基于所述第一实体的每一属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度,确定所述第一实体的每一属性与所述第二实体的每一属性之间的关联度。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一实体的每一属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度,确定所述第一实体的每一属性与所述第二实体的每一属性之间的关联度,包括:
针对每一组第一实体的属性和第二实体的属性,将所述第一实体的属性的每一属性值与所述第二实体的属性的每一属性值之间的关联度中的最大值,确定为所述第一实体的属性和所述第二实体的属性之间的关联度。
6.根据权利要求3至5中任一所述的方法,其特征在于,所述第一实体的属性信息包括第一属性张量,所述第二实体的属性信息包括第二属性张量,所述第二注意力分布参数包括属性注意力张量,所述第一属性张量和所述第二属性张量均为形状为K*N*D1的三维张量,所述属性注意力张量为形状为K*N*N的三维张量,其中,K为预设的属性数量最大值,N为预设的属性值数量最大值,D1为预设的属性值的表征向量的维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110361949.4/1.html,转载请声明来源钻瓜专利网。