[发明专利]多媒体文件的预测方法和装置有效

专利信息
申请号: 201711409084.4 申请日: 2017-12-22
公开(公告)号: CN108304459B 公开(公告)日: 2019-03-12
发明(设计)人: 张志伟;杨帆 申请(专利权)人: 北京达佳互联信息技术有限公司
主分类号: G06F16/44 分类号: G06F16/44
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100084 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 目标多媒体文件 多媒体文件 分布概率 图像识别算法 语音识别算法 自然语言处理 方法和装置 内容识别 算法 预测 标签 目标主题 主题集 预设 排序 统计
【说明书】:

发明提供了一种多媒体文件的预测方法和装置,其中,所述方法包括:对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到三个标签集;根据三个标签集,将目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计各目标多媒体文件在各主题中的分布概率;根据各目标多媒体文件在各主题中的分布概率及各主题中目标主题对应的条件分布概率,预测各目标多媒体文件的得分;按照得分对各目标多媒体文件进行排序。从而可以解决单独采用语音识别算法、图像识别算法或自然语言处理算法进行内容识别,准确性较差的问题,取得了提高多媒体文件内容识别的准确性的有益效果。

技术领域

本发明涉及软件应用技术领域,尤其涉及一种多媒体文件的预测方法和装置。

背景技术

近年来,深度学习在视频图像、语音识别、自然语言处理等领域得到了广泛应用。例如,对于视频图像而言,采用图像识别算法进行内容识别;对于语音数据,采用语音识别算法进行内容识别;对于文本数据,采用自然语音处理进行内容识别。

而在实际应用中,单独采用一种算法进行识别,往往无法准确的识别内容。例如,对于典型的UGC平台(User Generated Content,用户原创内容平台),每天均会有大量用户上传各种各样的视频,这些记录用户生活的视频包括自拍、跳舞、美食等内容。当要从数以亿计的视频中筛选出“美食教程”的视频时,若仅采用图像分类算法,虽然可以识别出“美食”视频,但无法识别出“教程”视频;若使用自然语言处理算法,虽然可以从文本中分离出“教程”以识别出“教程”视频,但无法识别图像中的“美食”;若把这个两个算法简单联合起来,虽然可以筛选出一定的“美食教程”视频,但并不是所有“美食教程”视频都包括“教程”字样,用户描述视频的文字很可能是“葱”、“姜”、“蒜”等食材。从而仅靠简单的算法融合无法准确识别内容。

发明内容

本发明实施例提供的多媒体文件的预测方法和装置,可解决单独采用语音识别算法、图像识别算法或自然语言处理算法进行内容识别,准确性较差的问题。

一方面,本发明实施例公开了一种多媒体文件的预测方法,包括:

对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到第一标签集、第二标签集及第三标签集;

根据所述第一标签集、第二标签集及第三标签集,将所述目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计所述各目标多媒体文件在各主题中的分布概率;

根据所述各目标多媒体文件在各主题中的分布概率以及各主题中目标主题对应的条件分布概率,预测所述各目标多媒体文件的得分;所述条件分布概率通过对训练多媒体文件集进行训练得到;

按照所述得分对所述各目标多媒体文件进行排序。

另一方面,本发明实施例还公开了一种多媒体文件的预测装置,包括:

标签获取模块,用于对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到第一标签集、第二标签集及第三标签集;

主题划分模块,用于根据所述第一标签集、第二标签集及第三标签集,将所述目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计所述各目标多媒体文件在各主题中的分布概率;

得分预测模块,用于根据所述各目标多媒体文件在各主题中的分布概率以及各主题中目标主题对应的条件分布概率,预测所述各目标多媒体文件的得分;所述条件分布概率通过对训练多媒体文件集进行训练得到;

排序模块,用于按照所述得分对所述各目标多媒体文件进行排序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711409084.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top