[发明专利]一种基于置信度和聚类的未标记样本选择的方法在审
申请号: | 201410395794.6 | 申请日: | 2014-08-12 |
公开(公告)号: | CN104156438A | 公开(公告)日: | 2014-11-19 |
发明(设计)人: | 王荣燕;谢延红 | 申请(专利权)人: | 德州学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/66 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 253000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于置信度和聚类的未标记样本选择的方法,首先将所有的未标记样本进行聚类,选择离簇边界比较近的样本,选出边界样本后,用已标记样本训练有监督的SVM分类器,并对选出的边界样本进行识别,选择不同置信度区间的未标记样本进行TSVM训练;得到样本的置信度后,定义某一阈值λ,选择置信度大于λ的未标记样本进入下一层的半监督学习,目的是使被选中的样本属于下一层分类器所对应类别的概率在上一层分类器的条件下最大;选取的未标记样本即能代表样本边界分布情况,又能使得每层选取的样本属于下一层分类器所对应类别的概率最大。 | ||
搜索关键词: | 一种 基于 置信 标记 样本 选择 方法 | ||
【主权项】:
一种基于置信度和聚类的未标记样本选择的方法,其特征在于,采用分层TSVM分类器和基于置信度和聚类的未标记样本选择的方法;具体包括:首先将所有的未标记样本进行聚类,选择离簇边界比较近的样本,选出边界样本后,用已标记样本训练有监督的SVM分类器,并对选出的边界样本进行识别,选择不同置信度区间的未标记样本进行TSVM训练;得到样本的置信度后,定义某一阈值λ,选择置信度大于λ的未标记样本进入下一层的半监督。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于德州学院,未经德州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410395794.6/,转载请声明来源钻瓜专利网。