[发明专利]一种融合节点的获取方法及装置在审
| 申请号: | 202111679119.2 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN116431817A | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 葛婷 | 申请(专利权)人: | 苏州国双软件有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/216;G06F40/284;G06F18/22;G06F18/25 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李婉 |
| 地址: | 215011 江苏省苏州市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 节点 获取 方法 装置 | ||
1.一种融合节点的获取方法,其特征在于,包括:
获取待融合节点的属性信息,所述属性信息包括多个预设的属性项的属性值;
获取目标节点的所述属性信息,所述目标节点包括待融合图谱中的节点;
获取第一属性值和第二属性值的相似度,作为目标属性项的相似度;所述第一属性值包括所述待融合节点的目标属性项的属性值,所述第二属性值包括所述目标节点的目标属性项的属性值,所述目标属性项包括所述待融合节点的属性信息和所述待融合节点的属性信息中相同的属性项;
依据各个所述目标属性项的相似度,获取所述目标节点和所述待融合节点的相似度;
将满足预设的相似度条件的目标节点作为所述待融合节点的融合节点,所述相似度条件包括与所述待融合节点的相似度大于第一预设阈值。
2.根据权利要求1所述的方法,其特征在于,所述属性项包括:名称、类别和至少一项其他属性项,所述获取目标节点的所述属性信息之前,还包括:
获取所述待融合图谱中的每一节点的名称的属性值和类别的属性值;
获取所述待融合图谱中的每一节点的名称的属性值和所述待融合节点的名称的属性值的相似度,作为每一节点与所述待融合节点的名称相似度;
将满足预设的候选融合条件的节点作为目标节点,所述候选融合条件包括类别与所述待融合节点的类别相同,且与所述待融合节点的名称相似度大于第二预设阈值。
3.根据权利要求1所述的方法,其特征在于,所述获取第一属性值和第二属性值的相似度,作为目标属性项的相似度,包括:
对所述第一属性值进行数值检测,以判断所述第一属性值是否包括数值;
若所述第一属性值包括数值,则获取所述第一属性值和所述第二属性值的文本相似度和数值相似度;
将所述文本相似度和所述数值相似度加权相加,得到所述第一属性值和所述第二属性值的相似度,作为所述目标属性项的相似度。
4.根据权利要求3所述的方法,其特征在于,所述获取所述第一属性值和所述第二属性值的文本相似度,包括:
获取所述第一属性值和所述第二属性值的距离,作为所述第一属性值和所述第二属性值的第一文本相似度;
将第一词集合和第二词集合的相同序位的词的余弦相似度加权相加,得到所述第一属性值和所述第二属性值的第二文本相似度,所述第一词集合包括依序排列的所述第一属性值中的各个词的词向量,所述第二词集合包括依序排列的所述第二属性值中的各个词的词向量;
将第一目标词集合的词向量数量和第二目标词集合的词向量数量的比值,作为所述第一属性值和所述第二属性值的第三文本相似度,所述第一目标词集合为所述第一词集合和所述第二词集合的交集,所述第二目标词集合为所述第一词集合和所述第二词集合的并集;
将所述第一文本相似度、所述第二文本相似度、和所述第三文本相似度加权相加,得到所述第一属性值和所述第二属性值的文本相似度。
5.根据权利要求3所述的方法,其特征在于,所述获取所述第一属性值和所述第二属性值的数值相似度包括:
获取所述第一属性值中的数值,作为第一数值;
获取所述第二属性值中的数值,作为第二数值;
获取所述第一数值和所述第二数值的差值;
依据所述差值,获取所述数值相似度,所述差值与所述数值相似度呈反相关。
6.根据权利要求1所述的方法,其特征在于,所述依据各个所述目标属性项的相似度,获取所述目标节点和所述待融合节点的相似度,包括:
将各个所述目标属性项的相似度加权相加,得到所述目标节点和所述待融合节点的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州国双软件有限公司,未经苏州国双软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111679119.2/1.html,转载请声明来源钻瓜专利网。





