[发明专利]融合分类和聚类的集成分类识别方法在审
申请号: | 201710123864.6 | 申请日: | 2017-03-03 |
公开(公告)号: | CN107563401A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 黄开竹;张锐;夏迎炬;候翠琴 | 申请(专利权)人: | 富士通株式会社;西交利物浦大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 苏州创元专利商标事务所有限公司32103 | 代理人: | 马明渡,王健 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 分类 集成 识别 方法 | ||
技术领域
本发明涉及一种计算机技术、模式识别领域,尤其涉及一种融合分类和聚类的集成分类识别方法。
背景技术
集成学习时模式识别与机器学习领域里的一种重要方法,主要指模式分类(或聚类)时,不只依赖一种分类(聚类)模型的结果,而是通过融合多种分类(或聚类)模型的结果以产生更准确的分类结果。集成学习在文献中包含多种方法。大体可分为(1)在源数据端(raw data)进行融合,这些方法包括各种Bagging、Boosting方法;(2)在各种模型的输出端进行结果融合,比如文献中最常见的投票方法。本申请中,我们考虑第二种方法的融合。
在基于模型输出端的集成学习中,传统的方法通常仅考虑融合各种分类模型的结果,或者仅融合聚类模型的结果。很少有文献将分类模型的结果和聚类模型的结果协同融合。因为聚类模型和分类模型或存在一定程度的互补性,仅只考虑融合聚类模型或分类模型,将会限制分类结果的精度,从而在实际中不能取得较好的结果。
发明内容
本发明的目的是提供一种融合分类和聚类的集成分类识别方法,该融合分类和聚类的集成分类识别方法虑融合聚类模型或分类模型,大大提高了分类结果的精度和识别率,从而在实际中取得更好的结果。
为达到上述目的,本发明采用的技术方案是:一种融合分类和聚类的集成分类识别方法,其特征在于:包括以下步骤:
步骤一、针对若干个待分类的样本,设定至少一个分类模型和至少一个聚类模型,每个分类模型均包括若干个分类组,此分类组作为将若干个待分类样本分类的依据,每个聚类模型均包括若干个聚类组,此聚类组根据相似性差异划分,位于聚类组中的样本有很大的相似性,而不同聚类组间的样本有很大的相异性;
步骤二、将各个待分类的样本均经过每个所述分类模型处理,获得每个样品属于每个分类组的次数,将各个待分类的样本均经过每个所述聚类模型处理,获得每个样品属于每个聚类模型的聚类组的次数,从而构造形成样本-组共现矩阵;
步骤三、根据步骤二的样本-组共现矩阵依次计算若干个待分类的样本中两两样本的聚类相似度,并形成样本聚类相似图矩阵S,具体为:依次计算每个聚类组第i个样本出现次数和第j个样本出现次数的乘积并将各个聚类组两两样本次数乘积叠加,如公式(1)所示:
;C为分类组的数目,G为分类组和聚类组的总的数目, 为第i个样本与第j个样本的相似度量,为第i个样本在k个组的次数,为第j个样本在k个组的次数;
步骤四、将步骤三获得的样本聚类相似图矩阵S进行归一化处理,从而将任意两两样本的相似度量的数值范围归一至0~1区间内,从而形成样本聚类归一化相似图矩阵W,样本聚类归一化相似图矩阵W中Wij为第i个样本和第j个样本相似度,0为不同,1为相同,位于0~1区间内数值越大越相似;
步骤五、根据步骤二的样本-组共现矩阵依次计算每个样本属于分类模型中每个分类组的概率,从而形成第i个样本属于各个的分类组的概率向量,为第i个样本属于每一分类组的概率向量,从而构造形成样本分类概率矩阵;
步骤六、基于步骤四的样本聚类归一化相似图矩阵W和步骤五的样本分类概率矩阵通过最小化函数(3)和函数(4),从而耦合了聚类归一化相似图矩阵和样本分类概率矩阵信息,从而获得修正后样本分类概率矩阵F,函数(3)和函数(4)的公式如下所示:
;其中:为第i个样本与第j个样本之间分类相似度,为第i个样本与第j个样本之间聚类相似度,
L=I-W,I为单位矩阵,、均为一个正参数,表示第j个组gj属于第z类的条件概率,,其中如果i=j, 则,否则;
较大,表示样本oi属于组gj的可能性很大,那么和则应该充分接近,所以最小化第一项;
前C个分类组{g1, g2,…gC}代表着类别,所以其条件概率应该充分接近Yj,因此最小化第二项 ;同时,考虑样本之间的相似性,最小化基于
图的正则化项;这三项用参数、进行调解;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社;西交利物浦大学,未经富士通株式会社;西交利物浦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710123864.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一维条码识别方法
- 下一篇:用于稀疏人工神经网络的计算装置和运算方法