[发明专利]一种标签补齐方法及装置在审

专利信息
申请号: 201810287854.0 申请日: 2018-03-31
公开(公告)号: CN110555137A 公开(公告)日: 2019-12-10
发明(设计)人: 胡磊;张旭 申请(专利权)人: 华为技术有限公司
主分类号: G06F16/78 分类号: G06F16/78;G06F16/71
代理公司: 11274 北京中博世达专利商标代理有限公司 代理人: 张皎皎
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 向量 标签 实体表示 标签集合 关系表示 匹配度 多媒体技术 标识确定 视频标签 视频生成 同质化 补齐 申请
【说明书】:

本申请实施例公开了一种标签补齐方法及装置,涉及多媒体技术领域,能够为缺失标签的视频生成标签,以及在一定程度上避免不同视频标签的同质化。包括:获取第一实体的候选标签集合;所述候选标签集合包括关系表示向量以及至少一个标签值表示向量;计算每一个所述标签值表示向量基于所述关系表示向量与所述第一实体的实体表示向量的匹配度;所述实体表示向量是根据所述第一实体的标识确定的表示向量;将与所述第一实体的实体表示向量匹配度较高的前N个标签值表示向量对应的标签作为为所述第一实体的标签;所述N为大于等于1的整数。

技术领域

本申请实施例涉及多媒体技术领域,尤其涉及一种标签补齐方法及装置。

背景技术

视频运营网站可以利用视频标签来标记视频内容,实现细粒度、多维度的视频索引。现有技术中,首先基于现有视频长评和简介,训练得到视频现有标签中每一个标签的表示向量,并根据表示向量计算标签之间的相似度,将相似的标签构成相似标签簇。对于标签比较匮乏的视频,可以将相似标签簇中除该视频的种子标签以外的其他标签推荐给该视频,从而完成标签的补齐或扩展。

但是,如果视频没有种子标签,如新加入的视频或冷门视频,该技术无法为该视频补齐标签。另外,由于是基于表示向量的相似性来补齐标签,最终导致各个视频的标签在语义上是非常相近的,同质化情况严重。

发明内容

本申请实施例提供一种标签补齐方法及装置,能够为缺失标签的视频生成标签,以及在一定程度上避免不同视频标签的同质化。

为达到上述目的,本申请实施例采用如下技术方案:

第一方面,本申请实施例提供了一种标签补齐方法,包括:对于待补齐标签的第一实体,首先获取第一实体的候选标签集合,其中,候选标签集合包括至少一个标签值表示向量。接着,还可以计算每一个标签值表示向量基于关系表示向量与第一实体的实体表示向量的匹配度,这里的实体表示向量可以是根据第一实体的标识确定的表示向量,关系表示向量指示的关系为标签,关系表示向量可以是根据“标签是”训练得到的表示向量。示例的,A和B满足的关系为“标签”,可以理解为A的标签是B。最后,将与第一实体的实体表示向量匹配度较高的前N个标签值表示向量对应的标签作为为第一实体的标签,其中,N为大于等于1的整数。

本发明实施例提供的标签补齐方法中,计算标签值表示向量在某关系下与实体表示向量的匹配度,即判断标签与实体是否满足该关系。标签值表示向量在某关系表示向量下与实体表示向量匹配,则说明实体名节点(即第一实体的实体表示向量对应的节点)与标签值节点(即标签值表示向量对应的节点)之间存在链接的可能,那么该标签值表示向量所对应的标签可以作为该实体的标签。也就是说,本发明实施例中通过链接预测实现实体的标签补齐,不需要待补齐标签的实体事先有种子标签。另外,本发明实施例决策补齐标签时,考虑的是向量空间中节点间的位置关系(即节点之间是否有链接可能)而非相似关系,因此避免补齐标签的同质化问题。可见,本发明实施例提供的方法能够为缺失标签的实体(如:视频、商品等)生成标签,以及在一定程度上避免不同实体标签的同质化。

结合第一方面,在第一方面的第一种可能的实现方式中,获取第一实体的候选标签集合具体包括:可以根据所有已有标签的实体的元数据确定元数据集合,元数据集合包括至少一个第二实体中每一个第二实体对应的属性以及各个属性对应的属性值;其中,第二实体与第一实体不同。进一步,还可以根据元数据集合生成有效表示向量集合,有效表示向量集合包括实体表示向量、关系表示向量、属性值表示向量、类型值表示向量以及标签值表示向量;最后,根据有效表示向量集合中的标签值表示向量构成候选标签集合。

也就是说,可以对所有实体的元数据进行训练结合,获得很多的表示向量,最终筛选其中的关系表示向量以及标签值表示向量构成候选标签集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810287854.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top