[发明专利]一种标签预测方法及装置有效
申请号: | 201710363676.0 | 申请日: | 2017-05-22 |
公开(公告)号: | CN108959304B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 魏溪含 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/58 | 分类号: | G06F16/58 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标签 预测 方法 装置 | ||
1.一种标签预测方法,其特征在于,包括:
获取至少一个图像数据集,所述图像数据集中的图像属于同一类别;
在预设的图像标签范围内分别对所述图像数据集中的图像进行标签预测,生成各个图像的至少一个预测标签;
分别统计每个预测标签出现的次数,获取所述次数满足预设条件的预测标签所对应的图像,设置所述图像所属的图像数据集的标签为所述预测标签;以便根据图像数据集的预测标签,将图像数据集合并至初始图像数据源中与预测标签相对应的初始图像数据集,其中,所述初始图像数据源包括多个图像标签下的初始图像数据集,所述预设的图像标签范围包括所述初始图像数据源中各个初始图像数据集的图像标签。
2.根据权利要求1所述的方法,其特征在于,在预设的图像标签范围内分别对所述图像数据集中的图像进行标签预测之前,所述方法还包括:
获取多个已知图像标签的图像样本;
对所述多个已知图像标签的图像样本进行深度学习处理,得到图像标签与图像之间的关系模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述多个已知图像标签的图像样本进行深度学习处理包括:
设置图像与图像标签的关系模型,所述关系模型中设置有训练参数;
将所述图像样本作为所述关系模型的输入数据,所述图像样本的图像标签作为所述关系模型的输出数据,调整所述训练参数,直至所述关系模型达到预设要求。
4.根据权利要求2或3所述的方法,其特征在于,所述在预设的图像标签范围内分别对所述图像数据集中的图像进行标签预测包括:
利用所述关系模型分别对所述图像数据集中的图像进行标签预测,生成各个图像的至少一个预测标签,其中,所述预测标签包含于所述图像样本的图像标签。
5.根据权利要求1所述的方法,其特征在于,所述图像数据集中的图像至少具有一个相同的图像标签。
6.根据权利要求1所述的方法,其特征在于,所述在预设的图像标签范围内分别对所述图像数据集中的图像进行标签预测包括:
按照预设规则对所述图像数据集中的图像进行采样;
在预设的图像标签范围内分别对采样后的图像进行标签预测。
7.根据权利要求1所述的方法,其特征在于,所述在预设的图像标签范围内分别对所述图像数据集中的图像进行标签预测包括:
在预设的图像标签范围内分别对所述图像数据集中的图像进行标签预测,生成各个图像的至少一个预测标签;
分别计算所述预测标签的置信度。
8.根据权利要求7所述的方法,其特征在于,所述分别统计每个预测标签出现的次数包括:
判断所述预测标签的置信度是否大于预设阈值;
若判断结果为是,则确定所述预测标签参与次数统计。
9.根据权利要求1所述的方法,其特征在于,所述预设条件包括下述中的至少一种:
所述次数大于第一阈值;
所述次数占所有预测标签出现总次数的比例大于第二阈值;
所述次数在预测标签出现次数按照从多到少的排序中至少位于第三阈值位之前。
10.根据权利要求1所述的方法,其特征在于,所述获取所述次数满足预设条件的预测标签所对应的图像,设置所述图像所属的图像数据集的标签为所述预测标签包括:
获取所述次数满足预设条件的预测标签所对应的图像;
从所述图像中筛选出数量不少于第四阈值的属于相同类别图像数据集的图像;
设置筛选得到的图像所属的图像数据集的标签为所述预测标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710363676.0/1.html,转载请声明来源钻瓜专利网。