[发明专利]基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法在审
申请号: | 201810233401.X | 申请日: | 2018-03-21 |
公开(公告)号: | CN108564107A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 王迪;刘倩倩;张笑钦;古楠楠;叶修梓 | 申请(专利权)人: | 温州大学苍南研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 温州名创知识产权代理有限公司 33258 | 代理人: | 陈加利 |
地址: | 325000 浙江省温州市苍南县*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字典学习 半监督 字典原子 正则化 无标签样本 标签向量 样本类别 构建 归类 相似度矩阵 训练样本集 测试样本 稀疏编码 稀疏表示 下降算法 线性重构 训练样本 点数据 图结构 有效地 鲁棒 求解 维度 重构 收敛 样本 字典 标签 分类 优化 学习 | ||
本发明公开了基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法,该方法包括:S1:根据训练样本构建基于原子拉普拉斯图正则化的半监督字典学习模型;S2:采用块坐标下降算法对所述的半监督字典学习模型中的各类变量进行优化,直到收敛;S3:根据所求解的字典原子标签以及无标签样本的稀疏编码,线性重构出测试样本的标签向量,并选取标签向量中元素最大的那个维度作为其所属的类别。本发明将字典原子看作重构训练样本集的锚点数据来构建字典原子之间的相似度矩阵,因此能够获得对异常样本更加鲁棒的图结构信息,这样迫使无标签样本能够更加有效地参与到字典学习过程中,使得学习的字典具有更好的稀疏表示能力和分类判别能力。
技术领域
本发明涉及计算机模式识别和机器学习领域,特别是涉及一种基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法。
背景技术
字典学习是利用普通稠密的训练样本学习一组过完备基(字典原子),从而获得输入样本在这些字典原子下的稀疏表达的过程,其广泛应用于图像处理方面,如图像恢复,图像压缩和图像分类等。简而言之,字典学习由稀疏表达和学习字典阶段两部分组成。因此,这导致学者可从字典的稀疏表示能力和分类判别能力两个角度来衡量学得字典的性能。字典的稀疏表示能力体现在能否用尽可能少的字典原子还原训练样本,而字典的分类判别能力则体现在各指定类的字典原子是否能够准确地判断出测试样本所属的类别。
从字典的稀疏表示能力角度考虑,众多学者已经提出了各种不同的字典学习算法。例如Wright等人将训练样本作为基原子构建字典,对测试样本进行稀疏编码重构,进而提出了一种基于稀疏表示的分类(SRC)算法。该方法虽然在人脸分类方面取得了突破性的进步,但是由于其将所有训练样本作为字典基原子,导致字典规模太大,从而对后续的稀疏求解不利。为了能够获得自适应于训练样本集的字典,Engan等人提出了最优方向算法(Method of Optimal Directions,MOD),它是一种在字典更新和稀疏编码之间交替迭代的优化过程。随后,Aharon和Elad等人提出了著名的K-SVD算法(广义的k-means),该方法能够同时更新字典和样本的稀疏表示系数,并能与任意一种匹配追踪算法,如FOCUSS,基追踪,匹配追踪等联合使用,这有利于实现字典对原始样本的稀疏表示。然而,以上方法均未充分利用到训练样本之间的类别信息,使得字典的判别能力较差。
为了提高字典的分类判别能力,研究者们提出了有监督的字典学习算法。例如Zhang等人引入了一个分类器,并在K-SVD的优化目标函数基础上添加了一项分类误差项,进而提出了判别性的K-SVD算法(D-KSVD),使得所学习到的字典具有良好的表示能力和判别性能。Jiang和Lin等人基于D-KSVD提出了标签一致性K-SVD算法(Label Consistent-KSVD,简称LC-KSVD),该方法通过在D-KSVD优化模型的基础上引入了一项“判别稀疏编码误差”的标签一致项,使得在字典学习过程中,不仅使用了训练数据的类别标签,而且将标签信息和每个字典基原子联系起来,从而达到增强字典的判别能力的效果。Yang和Zhang等人在稀疏编码上使用fisher判别标准来提高字典的判别能力,提出了费希尔判别性字典学习(Fisher Discrimination Dictionary Learning,FDDL)方法。
有监督的字典学习算法都是建立在训练样本全部是有标签的情况下,而有标签数据在现实生活中存在比较少且依赖于外界“导师”的标注,因此,在有标签样本数目较少时,其学习的字典的分类效果会受到影响。
发明内容
本发明的目的是为了克服现有技术存在的缺点和不足,而提供一种基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法,该方法对样本类别的归类具有更好的稀疏表示能力和判别能力。
为实现上述目的,本发明的技术方案是基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法,其特征在于,所述方法包括:
S1:根据训练样本构建基于原子拉普拉斯图正则化的半监督字典学习模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学苍南研究院,未经温州大学苍南研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810233401.X/2.html,转载请声明来源钻瓜专利网。