[发明专利]使用否定数据优化多类别多媒体数据分类有效
申请号: | 201680006455.1 | 申请日: | 2016-01-15 |
公开(公告)号: | CN107209861B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 华先胜;李劲;I·米斯拉 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;黄捷 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 否定 数据 优化 类别 多媒体 分类 | ||
描述了用于通过利用否定多媒体数据项训练和更新分类器来优化多类别图像分类的技术。该技术描述了访问多个多媒体数据项中的肯定多媒体数据项,从肯定多媒体数据项中提取特征,以及至少部分基于特征来训练分类器。分类器可以包括多个模型向量,每个模型向量对应于个体标签之一。系统可以使用肯定多媒体数据和否定多媒体数据迭代地测试分类器,并且可以取决于多媒体数据项是肯定的还是否定的来有区别地更新与分类器相关联的一个或多个模型向量。还描述了用于应用分类器以至少部分基于将相似度值与从分类器训练得到的相应统计值相比较来确定新的多媒体数据项是否与主题相关联的技术。
背景技术
计算机视觉可以包括对象识别、对象分类、对象类检测、图像分类等。对象识别可以描述寻找特定对象(例如,特定样式的手提包、特定人物的脸部等)。对象分类和对象类检测可以描述寻找属于特定类(例如,面部、鞋子、汽车等)的对象。多媒体数据分类可以描述将整个多媒体数据项分配给特定类(例如,位置识别、纹理分类等)。使用多媒体数据的计算机对象识别、检测和/或分类是具有挑战性的,因为一些对象和/或多媒体数据项可能不属于特定类,但是可能被(误)分类为与特定类相关联的标签,尽管其不属于该特定类。因此,用于准确地确定对象和/或多媒体数据项不是类的一部分(即,拒绝对象和/或多媒体数据项)的技术对于提高分类准确性是有用的。
用于拒绝对象和/或多媒体数据项的当前技术是容易出错的。用于拒绝对象和/或多媒体数据项的一种技术利用阈值来拒绝具有低于预定阈值的分类后(post-classification)值的任何对象和/或多媒体数据项。然而,通常,这种阈值技术不准确,并且与主题相关联的对象和/或多媒体数据项被错误地拒绝。例如,用户可以在“狗”类中输入用于分类的小狗的照片。由于小狗很难分类,所以分类器可能输出低于预定阈值的分类值,以表示该小狗不与“狗”类中的任何标签相关联。然而,小狗是一只狗,因此,这种分类是不准确的。
其他技术(例如,n+1分类技术)收集肯定和否定数据。肯定数据可以包括与类(例如,狗)中的标签相关联的对象和/或多媒体数据项。否定数据可以包括不与类中的任何标签相关联的对象和/或多媒体数据项(例如,不是狗)。这样的技术训练分类器以识别与类中的每个标签相关联的对象和/或多媒体数据项(例如,识别对象和/或多媒体数据项是特定类型的狗),以及识别与不与该类中的任何标签相关联的附加类相关联的对象和/或多媒体数据项(例如,识别对象和/或多媒体数据项不是狗)。然而,否定数据可以包括非常多样化的标签和类别集合,因此,个体模型可能不能准确地标识不属于类(例如,狗)中的标签的对象和/或多媒体数据项。
发明内容
本公开描述了用于通过利用否定多媒体数据项训练分类器来优化多类别多媒体数据分类的技术。通过提高对输入的多媒体数据项进行分类的准确性并且减少用于训练分类器的计算资源量,本文中描述的技术利用否定多媒体数据项来优化多类别多媒体数据分类。通过训练分类器以更好地区分与主题(例如,类、类别等)相关联的多媒体数据项和不与该主题相关联的多媒体数据项,利用否定多媒体数据项改进了分类器准确性。
本文中的系统和方法描述了访问多个多媒体数据项,其可以包括用于训练分类器的肯定多媒体数据项和否定多媒体数据项的。肯定多媒体数据项可以包括属于与主题相关联的标签的多媒体数据项。否定多媒体数据项可以包括不属于该主题的多媒体数据项。系统可以使用肯定多媒体数据和否定多媒体数据迭代地测试分类器,并且可以取决于多媒体数据项是肯定的还是否定的来有区别地更新与分类器相关联的模型向量。在一个示例中,系统可以访问多个否定多媒体数据项中的否定多媒体数据项。系统可以从否定多媒体数据项中提取特征,并且将分类器应用于特征以确定与和主题相关联的标签相对应的相似度值。分类器可以包括多个模型向量,每个模型向量对应于与主题相关联的标签之一。系统可以确定与特定标签相关联的相似度值大于与特定标签相关联的统计值。统计值可以由使用肯定多媒体数据项训练分类器来得出。至少部分基于确定相似度值大于统计值,系统可以调整与特定标签相对应的个体模型向量以更新分类器从而更准确地确定多媒体数据项是否属于主题。在附加或替代示例中,系统可以访问肯定多媒体数据项,并且可以使用不同的过程来更新分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680006455.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置