[发明专利]一种基于Bagging和离群点的分类结果置信度的度量方法在审
申请号: | 201710054802.4 | 申请日: | 2017-01-24 |
公开(公告)号: | CN106874944A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 严云洋;瞿学新;朱全银;于柿民;赵阳;唐海波;潘舒新 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 梁耀文 |
地址: | 223005 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Bagging和离群点的分类结果置信度的度量方法,首先采用Logistic回归、支持向量机和朴素贝叶斯中的一个作为基分类器对待度量置信度数据进行分类,计算在不同分类中的分类概率得到待度量置信度数据的分类结果集和分类概率集,通过分类结果集得到待度量置信度数据的分类结果;在分类概率集中,将每个分类作为空间中一个点,以分类结果对应分类概率集中的点作为离群点,余下分类对应分类概率集中的点为一个簇,最后使用欧式距离比较簇内每个点到簇质心的距离和到离群点的距离,若满足簇内所有点到簇质心的距离小于到离群点的距离,则该分类结果为可信,反之则为不可信。本发明避免了模型再学习时因采用了不可信的分类结果对训练模型的影响。 | ||
搜索关键词: | 一种 基于 bagging 离群 分类 结果 置信 度量 方法 | ||
【主权项】:
一种基于Bagging和离群点的分类结果置信度的度量方法,其特征在于,包括如下步骤:步骤一:对已有可信数据集采用Bagging集成学习方法,即采用Logistic回归、支持向量机和朴素贝叶斯中一个作为基分类器,得到基分类器的分类模型集;步骤二:通过步骤一得出的基分类器的分类模型集,对待度量置信度数据进行分类,并计算在不同分类中的分类概率,得到待度量置信度数据的分类结果集和待度量置信度数据的分类概率集,再对分类结果集进行统计,得到待度量置信度数据的分类结果;步骤三:采用离群点分析方法,对待度量置信度数据的分类结果进行置信度度量,得到待度量置信度数据中的可信数据和不可信数据,并将待度量置信度数据中满足置信条件的数据加入已有可信数据集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710054802.4/,转载请声明来源钻瓜专利网。