[发明专利]融合分类和聚类的集成分类识别方法在审
申请号: | 201710123864.6 | 申请日: | 2017-03-03 |
公开(公告)号: | CN107563401A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 黄开竹;张锐;夏迎炬;候翠琴 | 申请(专利权)人: | 富士通株式会社;西交利物浦大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 苏州创元专利商标事务所有限公司32103 | 代理人: | 马明渡,王健 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 分类 集成 识别 方法 | ||
1.一种融合分类和聚类的集成分类识别方法,其特征在于:包括以下步骤:
步骤一、针对若干个待分类的样本,设定至少一个分类模型和至少一个聚类模型,每个分类模型均包括若干个分类组,此分类组作为将若干个待分类样本分类的依据,每个聚类模型均包括若干个聚类组,此聚类组根据相似性差异划分,位于聚类组中的样本有很大的相似性,而不同聚类组间的样本有很大的相异性;
步骤二、将各个待分类的样本均经过每个所述分类模型处理,获得每个样品属于每个分类组的次数,将各个待分类的样本均经过每个所述聚类模型处理,获得每个样品属于每个聚类模型的聚类组的次数,从而构造形成样本-组共现矩阵;
步骤三、根据步骤二的样本-组共现矩阵依次计算若干个待分类的样本中两两样本的聚类相似度,并形成样本聚类相似图矩阵S,具体为:依次计算每个聚类组第i个样本出现次数和第j个样本出现次数的乘积并将各个聚类组两两样本次数乘积叠加,如公式(1)所示:
;C为分类组的数目,G为分类组和聚类组的总的数目, 为第i个样本与第j个样本的相似度量,为第i个样本在k个组的次数,为第j个样本在k个组的次数;
步骤四、将步骤三获得的样本聚类相似图矩阵S进行归一化处理,从而将任意两两样本的相似度量的数值范围归一至0~1区间内,从而形成样本聚类归一化相似图矩阵W,样本聚类归一化相似图矩阵W中Wij为第i个样本和第j个样本的相似度,0为不同,1为相同,位于0~1区间内数值越大越相似;
步骤五、根据步骤二的样本-组共现矩阵依次计算每个样本属于分类模型中每个分类组的概率,从而形成第i个样本属于各个的分类组的概率向量,为第i个样本属于每一分类组的概率向量,从而构造形成样本分类概率矩阵;
步骤六、基于步骤四的样本聚类归一化相似图矩阵W和步骤五的样本分类概率矩阵通过最小化函数(3)和函数(4),从而耦合了聚类归一化相似图矩阵和样本分类概率矩阵信息,从而获得修正后样本分类概率矩阵F,函数(3)和函数(4)的公式如下所示:
;其中:为第i个样本与第j个样本之间分类相似度,为第i个样本与第j个样本之间聚类相似度,
L=I-W,I为单位矩阵,、均为一个正参数,表示第j个组gj属于第z类的条件概率, ,其中如果i=j, 则,否则;
较大,表示样本oi属于组gj的可能性很大,那么和则应该充分接近,所以最小化第一项;
前C个分类组{g1, g2,… gC}代表着类别,所以其条件概率应该充分接近Yj,因此最小化第二项 ;同时,考虑样本之间的相似性,最小化基于
图的正则化项;这三项用参数、进行调解;
步骤七、根据步骤六获得的修正后样本分类概率矩阵F,取每个待分类的样本修正后的分类组中概率最好的分类作为该样本的分类,具体如公式(5)所示:
。
2.根据权利要求1所述的融合分类和聚类的集成分类识别方法,其特征在于:所述样本为图像(人脸、指纹、虹膜等)、语音、文本、文字或其他可分类数据。
3.根据权利要求1所述的融合分类和聚类的集成分类识别方法,其特征在于:所述步骤四、将步骤三获得的样本相似图矩阵进行归一化处理,从而将任意两两样本的相似度量的数值范围归一至0~1区间内,通过公式(2)获得:
;其中,函数是任意定义在实数矩阵连续可微分的凸函数,该优化可用投影优化方法或梯度下降方法求解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社;西交利物浦大学,未经富士通株式会社;西交利物浦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710123864.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一维条码识别方法
- 下一篇:用于稀疏人工神经网络的计算装置和运算方法