[发明专利]使用否定数据优化多类别多媒体数据分类有效

专利信息
申请号: 201680006455.1 申请日: 2016-01-15
公开(公告)号: CN107209861B 公开(公告)日: 2021-12-31
发明(设计)人: 华先胜;李劲;I·米斯拉 申请(专利权)人: 微软技术许可有限责任公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华;黄捷
地址: 美国华*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 否定 数据 优化 类别 多媒体 分类
【说明书】:

描述了用于通过利用否定多媒体数据项训练和更新分类器来优化多类别图像分类的技术。该技术描述了访问多个多媒体数据项中的肯定多媒体数据项,从肯定多媒体数据项中提取特征,以及至少部分基于特征来训练分类器。分类器可以包括多个模型向量,每个模型向量对应于个体标签之一。系统可以使用肯定多媒体数据和否定多媒体数据迭代地测试分类器,并且可以取决于多媒体数据项是肯定的还是否定的来有区别地更新与分类器相关联的一个或多个模型向量。还描述了用于应用分类器以至少部分基于将相似度值与从分类器训练得到的相应统计值相比较来确定新的多媒体数据项是否与主题相关联的技术。

背景技术

计算机视觉可以包括对象识别、对象分类、对象类检测、图像分类等。对象识别可以描述寻找特定对象(例如,特定样式的手提包、特定人物的脸部等)。对象分类和对象类检测可以描述寻找属于特定类(例如,面部、鞋子、汽车等)的对象。多媒体数据分类可以描述将整个多媒体数据项分配给特定类(例如,位置识别、纹理分类等)。使用多媒体数据的计算机对象识别、检测和/或分类是具有挑战性的,因为一些对象和/或多媒体数据项可能不属于特定类,但是可能被(误)分类为与特定类相关联的标签,尽管其不属于该特定类。因此,用于准确地确定对象和/或多媒体数据项不是类的一部分(即,拒绝对象和/或多媒体数据项)的技术对于提高分类准确性是有用的。

用于拒绝对象和/或多媒体数据项的当前技术是容易出错的。用于拒绝对象和/或多媒体数据项的一种技术利用阈值来拒绝具有低于预定阈值的分类后(post-classification)值的任何对象和/或多媒体数据项。然而,通常,这种阈值技术不准确,并且与主题相关联的对象和/或多媒体数据项被错误地拒绝。例如,用户可以在“狗”类中输入用于分类的小狗的照片。由于小狗很难分类,所以分类器可能输出低于预定阈值的分类值,以表示该小狗不与“狗”类中的任何标签相关联。然而,小狗是一只狗,因此,这种分类是不准确的。

其他技术(例如,n+1分类技术)收集肯定和否定数据。肯定数据可以包括与类(例如,狗)中的标签相关联的对象和/或多媒体数据项。否定数据可以包括不与类中的任何标签相关联的对象和/或多媒体数据项(例如,不是狗)。这样的技术训练分类器以识别与类中的每个标签相关联的对象和/或多媒体数据项(例如,识别对象和/或多媒体数据项是特定类型的狗),以及识别与不与该类中的任何标签相关联的附加类相关联的对象和/或多媒体数据项(例如,识别对象和/或多媒体数据项不是狗)。然而,否定数据可以包括非常多样化的标签和类别集合,因此,个体模型可能不能准确地标识不属于类(例如,狗)中的标签的对象和/或多媒体数据项。

发明内容

本公开描述了用于通过利用否定多媒体数据项训练分类器来优化多类别多媒体数据分类的技术。通过提高对输入的多媒体数据项进行分类的准确性并且减少用于训练分类器的计算资源量,本文中描述的技术利用否定多媒体数据项来优化多类别多媒体数据分类。通过训练分类器以更好地区分与主题(例如,类、类别等)相关联的多媒体数据项和不与该主题相关联的多媒体数据项,利用否定多媒体数据项改进了分类器准确性。

本文中的系统和方法描述了访问多个多媒体数据项,其可以包括用于训练分类器的肯定多媒体数据项和否定多媒体数据项的。肯定多媒体数据项可以包括属于与主题相关联的标签的多媒体数据项。否定多媒体数据项可以包括不属于该主题的多媒体数据项。系统可以使用肯定多媒体数据和否定多媒体数据迭代地测试分类器,并且可以取决于多媒体数据项是肯定的还是否定的来有区别地更新与分类器相关联的模型向量。在一个示例中,系统可以访问多个否定多媒体数据项中的否定多媒体数据项。系统可以从否定多媒体数据项中提取特征,并且将分类器应用于特征以确定与和主题相关联的标签相对应的相似度值。分类器可以包括多个模型向量,每个模型向量对应于与主题相关联的标签之一。系统可以确定与特定标签相关联的相似度值大于与特定标签相关联的统计值。统计值可以由使用肯定多媒体数据项训练分类器来得出。至少部分基于确定相似度值大于统计值,系统可以调整与特定标签相对应的个体模型向量以更新分类器从而更准确地确定多媒体数据项是否属于主题。在附加或替代示例中,系统可以访问肯定多媒体数据项,并且可以使用不同的过程来更新分类器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201680006455.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top