[发明专利]多媒体文件的预测方法和装置有效

专利信息
申请号: 201711409084.4 申请日: 2017-12-22
公开(公告)号: CN108304459B 公开(公告)日: 2019-03-12
发明(设计)人: 张志伟;杨帆 申请(专利权)人: 北京达佳互联信息技术有限公司
主分类号: G06F16/44 分类号: G06F16/44
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100084 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种多媒体文件的预测方法和装置,其中,所述方法包括:对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到三个标签集;根据三个标签集,将目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计各目标多媒体文件在各主题中的分布概率;根据各目标多媒体文件在各主题中的分布概率及各主题中目标主题对应的条件分布概率,预测各目标多媒体文件的得分;按照得分对各目标多媒体文件进行排序。从而可以解决单独采用语音识别算法、图像识别算法或自然语言处理算法进行内容识别,准确性较差的问题,取得了提高多媒体文件内容识别的准确性的有益效果。
搜索关键词: 目标多媒体文件 多媒体文件 分布概率 图像识别算法 语音识别算法 自然语言处理 方法和装置 内容识别 算法 预测 标签 目标主题 主题集 预设 排序 统计
【主权项】:
1.一种多媒体文件的预测方法,其特征在于,所述方法包括:对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到第一标签集、第二标签集及第三标签集;根据所述第一标签集、第二标签集及第三标签集,将所述目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计所述各目标多媒体文件在各主题中的分布概率;根据所述各目标多媒体文件在各主题中的分布概率以及各主题中目标主题对应的条件分布概率,预测所述各目标多媒体文件的得分;所述条件分布概率通过对训练多媒体文件集进行训练得到;其中,所述条件分布概率通过对训练多媒体文件集进行训练得到的步骤,包括:对训练多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到第一训练标签集、第二训练标签集及第三训练标签集;根据所述第一训练标签集、第二训练标签集及第三训练标签集,将所述训练多媒体文件集中的各训练多媒体文件划分至预设主题集的各主题中;根据所述各训练多媒体文件的标注信息,统计各主题中的训练多媒体文件属于目标主题的概率,得到各主题中目标主题对应的条件分布概率;按照所述得分对所述各目标多媒体文件进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711409084.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top