[发明专利]多媒体数据处理方法、装置及存储介质有效
申请号: | 201810044934.3 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108170845B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 张龙 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G06F16/432 | 分类号: | G06F16/432;G06F16/435;G06F16/48 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多媒体数据处理方法、装置及存储介质,该方法包括:接收待处理多媒体数据,并获取待处理多媒体数据的属性信息,其中属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;在多个标签列表一致时,根据多媒体数目和多媒体播放量生成待处理多媒体数据的热门度,并根据多媒体标识生成待处理多媒体数据的新颖度;在热门度小于预设热门阈值,且新颖度大于预设新颖阈值时,获取待处理多媒体数据的用户信息;根据用户信息对应的历史多媒体数据信息,待处理多媒体数据的多个标签列表、热门度和新颖度,处理待处理多媒体数据。本发明提高了处理多媒体数据的准确性。 | ||
搜索关键词: | 多媒体 数据处理 方法 装置 存储 介质 | ||
接收待处理多媒体数据,并获取所述待处理多媒体数据的属性信息,其中所述属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;
判断所述多个标签列表是否一致,若一致,则根据所述多媒体数目和所述多媒体播放量生成所述待处理多媒体数据的热门度,并根据所述多媒体标识生成所述待处理多媒体数据的新颖度;
对所述热门度和所述新颖度进行分析处理,若所述热门度小于预设热门阈值,且所述新颖度大于预设新颖阈值,则获取所述待处理多媒体数据的用户信息;以及
根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据。
2.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述判断所述多个标签列表是否一致步骤,包括:基于预设映射关系,将所述标签列表中的标签,映射至预设主词库中对应的主词上,以使每一标签列表形成一对应的主词列表;
判断任意两个所述主词列表是否都具有相同主词;
若任意两个所述主词列表都具有相同主词,则确定所述多个标签列表一致。
3.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述待处理多媒体数据包括待处理文本,而所述获取所述待处理多媒体数据的属性信息步骤包括:基于预设短语模板,从处于预设字数范围内的待处理文本中提取名词性短语作为标签,以形成所述标签列表;和/或
基于TextRank算法,从超出预设字数范围的待处理文本中提取标签,以形成所述标签列表。
4.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述待处理多媒体数据包括待处理图片,而所述获取所述待处理多媒体数据的属性信息步骤包括:提取所述待处理图片的噪声值、模糊度及曝光度,按照预设公式对所述待处理图片进行计算,生成打分结果;
判断所述打分结果是否小于预设分数阈值;
若所述打分结果不小于所述预设分数阈值,则提取所述待处理图片的标签,以形成所述标签列表。
5.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述待处理多媒体数据包括待处理音频,而所述获取所述待处理多媒体数据的属性信息步骤包括:获取所述待处理音频对应的多个预设标签;
对所述多个预设标签进行聚类,得到聚类标签,以形成所述标签列表。
6.根据权利要求1‑5任意一项所述的多媒体数据处理方法,其特征在于,所述根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据步骤,包括:获取所述用户信息对应的所述历史多媒体数据信息;
将已保留多媒体数据作为训练集,把所述历史多媒体数据信息、所述多个标签列表、所述热门度和所述新颖度作为特征值输入逻辑回归模型进行训练,得到训练结果;
判断所述训练结果是否满足预设条件;
若所述训练结果满足预设条件,则保留所述待处理多媒体数据。
7.根据权利要求1‑5任意一项所述的多媒体数据处理方法,其特征在于,所述根据所述多媒体标识生成所述待处理多媒体数据的新颖度步骤,包括:获取已保留多媒体数据的多媒体标识;
根据所述已保留多媒体数据的多媒体标识以及所述待处理多媒体数据的多媒体标识,确定所述待处理多媒体数据的新颖度。
8.一种多媒体数据处理装置,其特征在于,包括:接收模块,用于接收待处理多媒体数据,并获取所述待处理多媒体数据的属性信息,其中所述属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;
判断模块,用于判断所述多个标签列表是否一致,若一致,则根据所述多媒体数目和所述多媒体播放量生成所述待处理多媒体数据的热门度,并根据所述多媒体标识生成所述待处理多媒体数据的新颖度;
分析模块,用于对所述热门度和所述新颖度进行分析处理,若所述热门度小于预设热门阈值,且所述新颖度大于预设新颖阈值,则获取所述待处理多媒体数据的用户信息;以及
处理模块,用于根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据。
9.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述判断模块包括:映射子模块,用于基于预设映射关系,将所述标签列表中的标签,映射至预设主词库中对应的主词上,以使每一标签列表形成一对应的主词列表;
判断子模块,用于判断任意两个所述主词列表是否都具有相同主词;
第一确定子模块,用于在任意两个所述主词列表都具有相同主词时,确定所述多个标签列表一致。
10.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述待处理多媒体数据包括待处理文本,而所述接收模块包括:第一提取子模块,用于基于预设短语模板,从处于预设字数范围内的待处理文本中提取名词性短语作为标签,以形成所述标签列表;和/或
第二提取子模块,用于基于TextRank算法,从超出预设字数范围的待处理文本中提取标签,以形成所述标签列表。
11.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述待处理多媒体数据包括待处理图片,而所述接收模块包括:打分子模块,用于提取所述待处理图片的噪声值、模糊度及曝光度,按照预设公式对所述待处理图片进行计算,生成打分结果;
第一判断子模块,用于判断所述打分结果是否小于预设分数阈值;
提取子模块,用于在所述打分结果不小于所述预设分数阈值时,提取所述待处理图片的标签,以形成所述标签列表。
12.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述待处理多媒体数据包括待处理音频,而所述接收模块包括:获取子模块,用于获取所述待处理音频对应的多个预设标签;
聚类子模块,用于对所述多个预设标签进行聚类,得到聚类标签,以形成所述标签列表。
13.根据权利要求8‑12任意一项所述的多媒体数据处理装置,其特征在于,所述处理模块包括:信息获取子模块,用于获取所述用户信息对应的所述历史多媒体数据信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810044934.3/,转载请声明来源钻瓜专利网。