[发明专利]为媒体文件添加标签方法和使用该方法的系统无效

专利信息
申请号: 201010127016.0 申请日: 2010-03-18
公开(公告)号: CN102193946A 公开(公告)日: 2011-09-21
发明(设计)人: 刘媛;李滔;徐盈辉;陈义;张磊 申请(专利权)人: 株式会社理光
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市柳沈律师事务所 11105 代理人: 黄小临
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 媒体文件 添加 标签 方法 使用 系统
【说明书】:

技术领域

本发明涉及标签添加方法和使用该方法的系统,并且更具体地,涉及一种为内容文件添加标签的方法和系统。

背景技术

随着数字技术的普及,现在已经产生了大量的媒体文件,例如音频文件、视频文件、图片、文本以及其组合文件。大量音视频文件的出现为人们生动地记录和保存各种信息带来了便利。但是,随着这种媒体文件的大量产生,用户如何迅速地从这些大量的媒体文件中找到自己所需的文件成为一个问题。为了解决这个问题,人们提出为媒体文件添加能够描述其内容的文字标签,从而方便人们通过文字标签来查找各种媒体文件,这种为媒体文件添加文字标签的方法称之为“媒体文件标签法”,就是一种为图片、音乐片段以及视频片段添加关键字或关键词(也称之为标签)的一种行为。这些标签可以用于随后的各种媒体文件相关的应用中,例如用于多媒体管理、多媒体搜索、版权保护以及对象识别等等。

传统的媒体标签法采用人力对媒体文件添加标签,显然非常地费时费力,面对现今日益增长的媒体文件,单靠人力不可能对每个媒体文件添加标签。为此,美国专利申请US2008/0229192的发明人就提出了一种通过人机交互为图像添加标签的方法。该专利申请从墨迹注释出发,基于墨迹注释的结果执行墨迹识别处理,识别结果用于形成与图像文件相关联的一个或多个标签。然而,在实践中,大多数文件并不包含墨迹注释,尤其是视频文件和音频文件。因此,对于没有墨迹注释的文件,该专利申请所披露的技术方案是不能生成任何标签的。

美国专利20090289942提出一种图像自动标注技术,该方法首先建立一个标签词典,基于标签词典收集大量训练样本,对标签词典中存在的标签建立图模型(Graph Model),通过图的逐步迭代构建标签模型,该模型可自动完成对每个媒体文件添加标签。该专利的技术方案最大的缺陷在于只能处理有限的标签词典,对于新输入的图像,如果新输入的图像含有的标签在标签词典中不存在,则没有标签输出,导致失败;其次,该方法必须全自动完成,在标注过程中用户无法将先验知识传递给系统,造成先验知识的浪费。

发明内容

有鉴于上述问题,本发明提出了一种为媒体文件添加标签的方法和系统,其能够以全自动方式或者用户少量干预的半自动方式,为输入的媒体文件选择合适的文字标签来描述其内容,为后续的媒体文件检索、管理等实际应用提供有力的支持。

根据本发明的一个方面,提供了一种为媒体文件添加标签的方法,包括:基于已有的含有标签的媒体文件的训练样本构建标签的检测模型,基于所述训练样本中标签的出现频率提取标签之间的共存系数;输入媒体文件,并从所输入的媒体文件中提取视觉特征;获取所输入的媒体文件的初始标签;以及基于所述初始标签和所述训练样本中的标签之间的共存系数获取候选标签;以及基于所述输入媒体文件的视觉特征以及共存系数,使用标签检测模型从候选标签中选择能够描述输入媒体文件的标签集合。

根据本发明的为媒体文件添加标签的方法,所述基于已有的含有标签的媒体文件的训练样本构建标签的检测模型的步骤包括:基于所述训练样本形成标签词典,并收集所述标签词典中一个具体标签所属的训练样本;提取所收集的训练样本的视觉特征;基于所收集的训练样本以及所述训练样本的视觉特征,构建所述具体标签的检测模型,其中所构建的检测模型给出所述具体标签在一个媒体文件中的存在概率。

根据本发明的为媒体文件添加标签的方法,所述基于所述训练样本中标签的出现频率提取标签之间的共存系数的步骤包括:针对所有训练样本,统计两个标签存在于同一媒体文件中的数量,确定标签两两之间的共存频率;针对所有训练样本,统计其中存在所述两个标签两者和两者之一的媒体文件的数量或者统计其中存在所述两个标签之中的一个标签的媒体文件的数量;基于上述统计的媒体文件的数量,获得所述两个标签的共存系数。

根据本发明的为媒体文件添加标签的方法,其中所述获取所输入的媒体文件的初始标签的步骤可以通过一下方式之一来实现:用户主动提供初始标签、自动提取所输入的媒体文件自身携带的标签、自动提取所输入的媒体文件自身携带的其他信息,并转化成标签形式、利用所输入的媒体文件携带的其他信息,从第三方自动获取初始标签。

根据本发明的为媒体文件添加标签的方法,其中所述视觉特征包括但不限于:媒体文件的颜色、纹理、边缘方向等低层特征以及媒体文件的创建环境、创建时间等高层特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010127016.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top