[发明专利]目录树扩展方法、模型训练方法、装置、设备及存储介质在审
申请号: | 202111152792.0 | 申请日: | 2021-09-29 |
公开(公告)号: | CN114282066A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 王苏羽晨;赵瑞辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 孙晓丽 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目录 扩展 方法 模型 训练 装置 设备 存储 介质 | ||
本申请实施例公开了一种目录树扩展方法、模型训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取种子目录树中各个目录节点对应的第一关系向量和第二关系向量;遍历请求节点在种子目录树中的候选位置,基于候选位置中父节点的第一关系向量和子节点的第二关系向量,确定各个候选位置的位置分数;基于位置分数,将请求节点加入种子目录树中。通过同一种关系匹配方法检测请求节点能否作为目录节点的父节点或子节点,候选位置的评分本质上是对目录节点的评分,能够降低关系预测复杂度,减少计算冗余,提高目录树的扩展效率。
技术领域
本申请实施例涉及人工智能技术领域,特别涉及一种目录树扩展方法、模型训练方法、装置、设备及存储介质。
背景技术
目录树是一种表示上下位词关系的、具有层级状结构的知识图谱,目录树中的每条边连接一对父子节点。应用过程中,对于领域中新的名词和概念等需要及时补充,即在目录树中合适的位置添加对应的节点,进行目录树的扩展和更新。
相关技术中,目录树的自动更新通常采用目录树完成(Taxonomy Completion)任务,采用三重匹配网络,将请求节点(欲加入目录树的新节点)与种子目录树(加入新节点前原有的目录树)中的各个候选位置进行匹配,计算各个候选位置的分数,从而选择分数最高的位置进行节点添加。
然而,相关技术中每个候选位置分数的计算,需要利用三个不同的神经张量网络分别对(p,q)、(q,c)和(q,[p,c])三者(q为请求节点,p为候选位置的父节点,c为候选位置的子节点)进行匹配,将三者的关系表征向量进行拼接再评分,造成了模块冗余,降低训练效率;且对于每个候选位置都需要进行一次上述匹配流程,而候选位置的数量与节点数的平方呈正比,即候选位置数远远大于种子目录树中的节点数,时间复杂度较高,匹配效率低。
发明内容
本申请实施例提供了一种目录树扩展方法、模型训练方法、装置、设备及存储介质,能够降低关系匹配的复杂度、减少计算冗余,提高目录树的扩展效率。
所述技术方案如下:
一方面,本申请实施例提供了一种目录树扩展方法,所述方法包括:
获取种子目录树中各个目录节点对应的第一关系向量和第二关系向量,所述第一关系向量用于表示所述目录节点是请求节点的父节点时二者的关系特征,所述第二关系向量用于表示所述请求节点是所述目录节点的父节点时二者的关系特征;
遍历所述请求节点在所述种子目录树中的候选位置,基于候选位置中父节点的第一关系向量和子节点的第二关系向量,确定各个候选位置的位置分数,所述候选位置是指所述种子目录树中一对父子节点之间的位置,所述位置分数表征所述请求节点与候选位置的匹配程度;
基于所述位置分数,将所述请求节点加入所述种子目录树中。
另一方面,本申请实施例提供了一种模型训练方法,所述方法包括:
将样本请求节点以及样本父子节点的表征向量输入关系匹配模型,得到样本父节点的第一关系向量和样本子节点的第二关系向量,所述样本请求节点和所述样本父子节点是从种子目录树中抽取到的,所述第一关系向量用于表示所述样本父节点是所述样本请求节点的父节点时二者的关系特征,所述第二关系向量用于表示所述样本请求节点是所述样本子节点的父节点时二者的关系特征;
基于所述第一关系向量确定所述样本父节点的第一节点分数,以及基于所述第二关系向量确定所述样本子节点的第二节点分数;
基于正负样本父节点的第一节点分数,以及正负样本子节点的第二节点分数,对所述关系匹配模型进行迭代训练,其中,正样本父节点为所述样本请求节点在真实位置处的父节点,正样本子节点为所述样本请求节点在真实位置处的子节点。
另一方面,本申请实施例提供了一种目录树扩展装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111152792.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于管理卷积计算的方法和对应设备
- 下一篇:针对非蜂窝覆盖范围的紧急通信路由