[发明专利]融合分类和聚类的集成分类识别方法在审

申请号：	201710123864.6	申请日：	2017-03-03
公开（公告）号：	CN107563401A	公开（公告）日：	2018-01-09
发明（设计）人：	黄开竹;张锐;夏迎炬;候翠琴	申请（专利权）人：	富士通株式会社;西交利物浦大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	苏州创元专利商标事务所有限公司32103	代理人：	马明渡,王健
地址：	日本神***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种融合分类和聚类的集成分类识别方法，包括以下步骤针对若干个待分类的样本，设定至少一个分类模型和至少一个聚类模型；获得每个样品属于每个分类组的次数，获得每个样品属于每个聚类模型的聚类组的次数，形成样本‑组共现矩阵；根据样本‑组共现矩阵依次计算若干个待分类的样本中两两样本的聚类相似度，形成样本聚类相似图矩阵；基于样本聚类归一化相似图矩阵W和样本分类概率矩阵耦合了聚类归一化相似图矩阵和样本分类概率矩阵信息，从而获得修正后样本分类概率矩阵。本发明融合分类和聚类的集成分类识别方法虑融合聚类模型或分类模型，大大提高了分类结果的精度，从而在实际中取得更好的结果。
搜索关键词：	融合分类集成识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种融合分类和聚类的集成分类识别方法，其特征在于：包括以下步骤：步骤一、针对若干个待分类的样本，设定至少一个分类模型和至少一个聚类模型，每个分类模型均包括若干个分类组，此分类组作为将若干个待分类样本分类的依据，每个聚类模型均包括若干个聚类组，此聚类组根据相似性差异划分，位于聚类组中的样本有很大的相似性，而不同聚类组间的样本有很大的相异性；步骤二、将各个待分类的样本均经过每个所述分类模型处理，获得每个样品属于每个分类组的次数，将各个待分类的样本均经过每个所述聚类模型处理，获得每个样品属于每个聚类模型的聚类组的次数，从而构造形成样本‑组共现矩阵；步骤三、根据步骤二的样本‑组共现矩阵依次计算若干个待分类的样本中两两样本的聚类相似度，并形成样本聚类相似图矩阵S，具体为：依次计算每个聚类组第i个样本出现次数和第j个样本出现次数的乘积并将各个聚类组两两样本次数乘积叠加，如公式（1）所示：；C为分类组的数目，G为分类组和聚类组的总的数目，为第i个样本与第j个样本的相似度量，为第i个样本在k个组的次数，为第j个样本在k个组的次数；步骤四、将步骤三获得的样本聚类相似图矩阵S进行归一化处理，从而将任意两两样本的相似度量的数值范围归一至0~1区间内，从而形成样本聚类归一化相似图矩阵W，样本聚类归一化相似图矩阵W中Wij为第i个样本和第j个样本的相似度，0为不同，1为相同，位于0~1区间内数值越大越相似；步骤五、根据步骤二的样本‑组共现矩阵依次计算每个样本属于分类模型中每个分类组的概率，从而形成第i个样本属于各个的分类组的概率向量，为第i个样本属于每一分类组的概率向量，从而构造形成样本分类概率矩阵；步骤六、基于步骤四的样本聚类归一化相似图矩阵W和步骤五的样本分类概率矩阵通过最小化函数（3）和函数（4），从而耦合了聚类归一化相似图矩阵和样本分类概率矩阵信息，从而获得修正后样本分类概率矩阵F，函数（3）和函数（4）的公式如下所示：；其中：为第i个样本与第j个样本之间分类相似度，为第i个样本与第j个样本之间聚类相似度，L=I‑W，I为单位矩阵，、均为一个正参数，表示第j个组gj属于第z类的条件概率, ,其中如果i=j, 则,否则；较大，表示样本oi属于组gj的可能性很大，那么和则应该充分接近，所以最小化第一项；前C个分类组{g1, g2,… gC}代表着类别，所以其条件概率应该充分接近Yj，因此最小化第二项；同时，考虑样本之间的相似性，最小化基于图的正则化项；这三项用参数、进行调解；步骤七、根据步骤六获得的修正后样本分类概率矩阵F，取每个待分类的样本修正后的分类组中概率最好的分类作为该样本的分类，具体如公式（5）所示：。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于富士通株式会社;西交利物浦大学，未经富士通株式会社;西交利物浦大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710123864.6/，转载请声明来源钻瓜专利网。

上一篇：一维条码识别方法
下一篇：用于稀疏人工神经网络的计算装置和运算方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]融合分类和聚类的集成分类识别方法在审

专利文献下载