[发明专利]样本识别方法和装置在审
申请号: | 201910665996.0 | 申请日: | 2019-07-23 |
公开(公告)号: | CN112308097A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 祖辰;罗尚勇 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 许蓓 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 识别 方法 装置 | ||
本公开提出一种样本识别方法和装置,涉及数据挖掘领域。本公开,一方面,基于类间散度矩阵与类内散度矩阵的差值关系构建目标函数,使得投影矩阵求解过程中避免类内散度矩阵的逆矩阵的运算,当样本特征维度大于样本数目时,依然可以求得投影矩阵的最优解;另一方面,通过类间散度矩阵和类内散度矩阵的加权自适应机制,自动寻找类间散度矩阵和类内散度矩阵的最优加权系数,以使得总体协方差矩阵估计得更准确,进而使得求解得到的投影矩阵更准确。
技术领域
本公开涉及数据挖掘领域,特别涉及一种样本识别方法和装置。
背景技术
随着信息技术的发展,产生了高维度数据,例如基因数据、图像数据等。
特征抽取方法是对高维度数据进行挖掘的其中一种方法。特征抽取方法通过投影矩阵将原始高维特征向低维空间进行投影,从而降低原始特征的维度。
线性判别分析(Linear Discriminant Analysis,LDA)是一种有监督的特征抽取方法,其目标是求得一个线性投影矩阵W∈RD×d使得基于类间散度矩阵Sb与类内散度矩阵Sw的比值关系所构建的目标函数tr()的值最大,公式表示为:
其中,max表示计算最大值,tr()表示计算矩阵的迹。
发明内容
发明人发现:当样本特征维度大于样本数目时(即小样本问题时),类内散度矩阵Sw不可逆,导致不存在,无法求得线性投影矩阵W的最优解。此外,当样本数量少时,使用样本协方差矩阵估计总体协方差矩阵不准确,类内散度矩阵偏大,类间散度矩阵偏小,进而使得求解得到的投影矩阵不准确。
为了解决上述的至少一个问题,提出本公开。一方面,本公开基于类间散度矩阵与类内散度矩阵的差值关系构建目标函数,使得投影矩阵求解过程中避免类内散度矩阵的逆矩阵的运算,当样本特征维度大于样本数目时,依然可以求得投影矩阵的最优解。另一方面,通过类间散度矩阵和类内散度矩阵的加权自适应机制,自动寻找类间散度矩阵和类内散度矩阵的最优加权系数,以使得总体协方差矩阵估计得更准确,进而使得求解得到的投影矩阵更准确。
根据本公开的一个方面,提出一种样本识别方法,包括:
计算包含多个训练样本的训练集的类内散度矩阵和类间散度矩阵,其中,训练样本用训练样本在第一维度空间的特征信息和训练样本的类别标签信息进行描述;
基于类间散度矩阵与类内散度矩阵的差值关系,构建目标函数;
根据所述目标函数,确定从第一维度空间转换到第二维度空间的投影矩阵,其中,第一维度空间的维度数量大于第二维度空间的维度数量,以便利用所述投影矩阵对待测样本在第一维度空间的特征信息进行降维得到待测样本在第二维度空间的特征信息,并基于待测样本在第二维度空间的特征信息对待测样本进行识别。
在一些实施例中,在所述目标函数中,类间散度矩阵与类内散度矩阵加权后再相减,并且类间散度矩阵的加权系数与类内散度矩阵的加权系数的指数不同。
在一些实施例中,所述目标函数为:
其中,WTW=I,W表示投影矩阵,I表示单位矩阵,Sb表示类间散度矩阵,Sw表示类内散度矩阵,α表示类间散度矩阵的加权系数,α2表示类内散度矩阵的加权系数,max表示计算最大值,tr()表示计算矩阵的迹。
在一些实施例中,确定从第一维度空间转换到第二维度空间的投影矩阵包括:
固定所述目标函数中的类间散度矩阵和类内散度矩阵的加权系数,计算所述目标函数中的投影矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910665996.0/2.html,转载请声明来源钻瓜专利网。