[发明专利]多媒体资源的标签构建方法、装置、电子设备及存储介质在审
申请号: | 202210262736.0 | 申请日: | 2022-03-17 |
公开(公告)号: | CN114564602A | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 王霄;聂礼强;张博威;甘甜;宋雪萌;戴蒙 | 申请(专利权)人: | 北京达佳互联信息技术有限公司;山东大学 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F40/216;G06F16/45;G06K9/62 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 黄丽霞 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 资源 标签 构建 方法 装置 电子设备 存储 介质 | ||
1.一种多媒体资源的标签构建方法,其特征在于,所述方法包括:
获取待构建标签的多媒体资源,所述多媒体资源包括多个多媒体;
从多个多媒体中确定目标标签集,所述目标标签集包括多个目标标签;
根据所述目标标签集中任一标签对所对应的多媒体,获取所述标签对的统计特征,所述标签对为在同一多媒体中出现的任意两个目标标签;
根据所述标签对的统计特征确定所述标签对的关系类别;
根据每个所述标签对的关系类别构建所述多媒体资源的标签体系。
2.根据权利要求1所述的方法,其特征在于,所述从多个多媒体中确定目标标签集,包括:
获取每个多媒体的文本信息,所述文本信息包括所述多媒体的标题与所述多媒体的封面文本组成的拼接字符串;
识别每个多媒体的文本信息中的关键词,并获取每个关键词的频数;
根据每个关键词以及对应的频数获取满足设定条件的关键词为候选标签;
获取每个所述候选标签的特征表示,根据所述特征表示确定目标标签,得到所述目标标签集。
3.根据权利要求2所述的方法,其特征在于,所述多媒体还包括对应的类目信息;所述获取每个所述候选标签的特征表示,根据所述特征表示确定目标标签,包括:
根据每个所述候选标签对应的多媒体以及所述多媒体对应的类目信息,获取所述候选标签的特征表示,所述特征表示包括所述候选标签向所述类目信息中任一类目的转移特征以及对应的特征熵;
将所述候选标签的特征表示输入训练后的预测模型,得到所述预测模型输出的所述候选标签的特征参数;
获取所述特征参数达到参数阈值的候选标签作为目标标签。
4.根据权利要求3所述的方法,其特征在于,所述转移特征的获取方法包括:
获取多媒体资源对应类目信息中任一类目信息对应的多媒体中所述候选标签的第一出现频数,以及获取多媒体资源中所有多媒体中所述候选标签的第二出现频数;
根据所述第一出现频数与所述第二出现频数确定所述候选标签向任一类目的转移特征。
5.根据权利要求4所述的方法,其特征在于,所述特征熵的获取方法包括:
根据所述多媒体资源中所述多媒体对应的类目信息,以及所述候选标签向任一类目的转移特征,计算所述候选标签向任一类目的转移特征对应的特征熵。
6.根据权利要求3所述的方法,其特征在于,所述预测模型的基础模型采用随机森林分类器;所述预测模型的获取方法包括:
获取训练集,所述训练集包括相同数量的标签样本正例和标签样本负例,所述标签样本正例为从预设的置信标签集中选取的标签样本,所述标签样本负例为从所述候选标签中选取的标签样本;
获取所述训练集中每个标签样本的样本特征表示,所述样本特征表示包括所述标签样本向任一类目的样本转移特征以及对应的样本特征熵;
采用每个标签样本的样本特征表示训练所述随机森林分类器,得到训练后的预测模型。
7.一种多媒体资源的标签构建装置,其特征在于,包括:
多媒体资源获取模块,被配置为执行获取待构建标签的多媒体资源,所述多媒体资源包括多个多媒体;
目标标签集确定模块,被配置为执行从多个多媒体中确定目标标签集,所述目标标签集包括多个目标标签;
统计特征获取模块,被配置为执行根据所述目标标签集中任一标签对所对应的多媒体,获取所述标签对的统计特征,所述标签对为在同一多媒体中出现的任意两个目标标签;
关系类别识别模块,被配置为执行根据所述标签对的统计特征确定所述标签对的关系类别;
标签体系构建模块,被配置为执行根据每个所述标签对的关系类别构建所述多媒体资源的标签体系。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的多媒体资源的标签构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司;山东大学,未经北京达佳互联信息技术有限公司;山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210262736.0/1.html,转载请声明来源钻瓜专利网。