[发明专利]一种基于相似度的多示例字典学习分类方法及装置有效
| 申请号: | 201910204869.0 | 申请日: | 2019-03-18 |
| 公开(公告)号: | CN109919165B | 公开(公告)日: | 2021-07-06 |
| 发明(设计)人: | 倪文;刘波;肖燕珊;廖嘉林 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
| 地址: | 510060 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 相似 示例 字典 学习 分类 方法 装置 | ||
本发明公开了一种基于相似度的多示例字典学习分类方法,包括:获得训练集;针对从正包集合中选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练分类器,直至满足预设的迭代停止条件:分别计算训练集中每个示例对于正类和负类的相似性权重;将训练集中每个示例经过字典学习,获得每个示例的稀疏编码;学习一个投影字典,将每个示例的稀疏编码重新表示;基于投影重新表示的每个示例及每个示例的相似性权重,训练分类器;基于训练后的分类器,获得目标包所属类别。应用本发明实施例所提供的技术方案,可以对目标包进行类别的准确确定,提高了分类器的分类效果。本发明还公开了一种基于相似度的多示例字典学习分类装置,具有相应技术效果。
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种基于相似度的多示例字典学习分类方法及装置。
背景技术
随着计算机技术的快速发展,多示例学习的受关注程度越来越高。多示例学习被提出是用来解决包的分类问题的,包中由许多示例所构成。对于一个正包,它至少包含一个正示例,相反的,对于负包,它仅仅由负示例所构成。
如今,多示例学习已经广泛地应用于多种现实领域,例如:对于药物分子活性预测、数据挖掘、图像分类、文本分类、恶意软件分类等等。以图像分类为例,大多数情况下,是将整副图像进行标记,而不是将图像中的每个区域进行标记。如图1所示,在这副被标记为“马”的图像中,除了包含与标记为“马”对应的区域外,还包含其他与标记无关的区域,如“草地”、“树木”,这些无关的区域往往会成为“噪声”,影响分类器的分类效果。有人提出对图像的每个区域进行精确标记来排除掉这些噪声区域对分类器分类效果的影响,但是这样做需要花费很大的人力、物力。但是,如果把图像分割成许多区域,每个区域看作是一个示例,图像看作是包,则图像分类问题就可以在多示例学习的框架下得以解决。此外,如果图像中至少有一个区域包含所指示的对象,则此图像就被称为正包,否则,这张图像就叫做负包。利用多示例学习可以提高图像分类的效率。
目前,关于多示例学习已经做了很多工作。常见的如Diverse Density(DD)方法,旨在找到一个数据点(目标概念),该数据点与正包中的示例最接近,与负包的示例最远。如果所选数据点与其任何示例之间的距离均小于阈值,则测试包被分类为正。
而在实际应用中,训练集正包中的模糊示例对分类器的训练的影响较大,现有技术中的方法并未考虑到这种影响,导致分类器的分类效果不是很理想,准确率不高。
发明内容
本发明的目的是提供一种基于相似度的多示例字典学习分类方法及装置,以准确确定包的类别,提高分类器的分类效果。
为解决上述技术问题,本发明提供如下技术方案:
一种基于相似度的多示例字典学习分类方法,包括:
获得训练集,所述训练集包含正包集合和负包集合,所述正包集合和所述负包集合中的每个示例均由基于相似性的数据模型表示;
依次从所述正包集合中选择一个正候选示例,针对选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练基于支持向量机的分类器,直至满足预设的迭代停止条件:
分别计算所述训练集中每个示例对于正类和负类的相似性权重,其中,所述正候选示例与正类和负类的相似性权重分别为1和0,所述负包集合中的每个示例与正类和负类的相似性权重分别为0和1;
将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码;
学习一个投影字典,将每个示例的稀疏编码重新表示;
基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器;
基于训练后的所述分类器,获得待进行类别确定的目标包所属类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910204869.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户界面对象的识别方法及装置
- 下一篇:获取属性的分类信息的方法和装置





