[发明专利]多媒体文件的预测方法和装置有效
申请号: | 201711409084.4 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108304459B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 张志伟;杨帆 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/44 | 分类号: | G06F16/44 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标多媒体文件 多媒体文件 分布概率 图像识别算法 语音识别算法 自然语言处理 方法和装置 内容识别 算法 预测 标签 目标主题 主题集 预设 排序 统计 | ||
本发明提供了一种多媒体文件的预测方法和装置,其中,所述方法包括:对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到三个标签集;根据三个标签集,将目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计各目标多媒体文件在各主题中的分布概率;根据各目标多媒体文件在各主题中的分布概率及各主题中目标主题对应的条件分布概率,预测各目标多媒体文件的得分;按照得分对各目标多媒体文件进行排序。从而可以解决单独采用语音识别算法、图像识别算法或自然语言处理算法进行内容识别,准确性较差的问题,取得了提高多媒体文件内容识别的准确性的有益效果。
技术领域
本发明涉及软件应用技术领域,尤其涉及一种多媒体文件的预测方法和装置。
背景技术
近年来,深度学习在视频图像、语音识别、自然语言处理等领域得到了广泛应用。例如,对于视频图像而言,采用图像识别算法进行内容识别;对于语音数据,采用语音识别算法进行内容识别;对于文本数据,采用自然语音处理进行内容识别。
而在实际应用中,单独采用一种算法进行识别,往往无法准确的识别内容。例如,对于典型的UGC平台(User Generated Content,用户原创内容平台),每天均会有大量用户上传各种各样的视频,这些记录用户生活的视频包括自拍、跳舞、美食等内容。当要从数以亿计的视频中筛选出“美食教程”的视频时,若仅采用图像分类算法,虽然可以识别出“美食”视频,但无法识别出“教程”视频;若使用自然语言处理算法,虽然可以从文本中分离出“教程”以识别出“教程”视频,但无法识别图像中的“美食”;若把这个两个算法简单联合起来,虽然可以筛选出一定的“美食教程”视频,但并不是所有“美食教程”视频都包括“教程”字样,用户描述视频的文字很可能是“葱”、“姜”、“蒜”等食材。从而仅靠简单的算法融合无法准确识别内容。
发明内容
本发明实施例提供的多媒体文件的预测方法和装置,可解决单独采用语音识别算法、图像识别算法或自然语言处理算法进行内容识别,准确性较差的问题。
一方面,本发明实施例公开了一种多媒体文件的预测方法,包括:
对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到第一标签集、第二标签集及第三标签集;
根据所述第一标签集、第二标签集及第三标签集,将所述目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计所述各目标多媒体文件在各主题中的分布概率;
根据所述各目标多媒体文件在各主题中的分布概率以及各主题中目标主题对应的条件分布概率,预测所述各目标多媒体文件的得分;所述条件分布概率通过对训练多媒体文件集进行训练得到;
按照所述得分对所述各目标多媒体文件进行排序。
另一方面,本发明实施例还公开了一种多媒体文件的预测装置,包括:
标签获取模块,用于对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到第一标签集、第二标签集及第三标签集;
主题划分模块,用于根据所述第一标签集、第二标签集及第三标签集,将所述目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计所述各目标多媒体文件在各主题中的分布概率;
得分预测模块,用于根据所述各目标多媒体文件在各主题中的分布概率以及各主题中目标主题对应的条件分布概率,预测所述各目标多媒体文件的得分;所述条件分布概率通过对训练多媒体文件集进行训练得到;
排序模块,用于按照所述得分对所述各目标多媒体文件进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711409084.4/2.html,转载请声明来源钻瓜专利网。