[发明专利]基于增强聚类的机器学习算法及该算法的应用在审
申请号: | 201710359205.2 | 申请日: | 2017-05-19 |
公开(公告)号: | CN107016131A | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 胡福文;程佳剑 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06N99/00 |
代理公司: | 北京爱普纳杰专利代理事务所(特殊普通合伙)11419 | 代理人: | 王玉松 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 增强 机器 学习 算法 应用 | ||
1.一种基于增强聚类的机器学习算法,所述算法至少包括下述步骤:
S1、分析目标对象的基础数据的特征,随机编写N个特征模板,其中,每个特征模板可将基础数据划分为符合该特征模板的数据和不符合该特征模板的数据;
S2、应用步骤S1编写的N个特征模板,在工作环境下依次对在线获得的数据进行分类测试;
S3、统计分类测试结果,得到每一个特征模板分类的成功率,并预设分类的失败标准为分类失败率n%;计算所有特征模板匹配成功率的平均值xmean与最大值xmax,以及最大值与平均之差为xd;
若xd不大于n%,则认为N个特征模板分类水平一致,均能达到目标要求,则至S7;
若xd大于n%,则依次计算成功率最大值xmax与其余各特征模板成功率之间的距离Δx1,若Δx1<xd,则将对应的特征模板作为较好的特征模板子集,并形成待测试特征模板集合;反之则淘汰该特征模板;
S4、针对步骤S3产生的测试特征模板集合,在工作环境下依次对在线获得的数据进行分类测试;
S5、统计分类测试结果,得到每一个特征模板分类的成功率,计算所有特征模板匹配成功率的平均值xmean与最大值xmax,以及最大值与平均之差为xd;
若xd不大于n%,则认为N个特征模板分类水平一致,均能达到目标要求,则至S7;
若xd大于n%,则依次计算成功率最大值xmax与其余各特征模板成功率之间的距离Δx2,若Δx2<xa,其中xa不大于xd,则将对应的特征模板作为较好的特征模板子集,并形成待测试特征模板集合;反之则淘汰该特征模板;
S6、重复步骤S4和S5,直到达到预设的分类成功率阈值;
S7、机器学习过程结束,并选取N个特征模板中成功率最高者作为最优的特征识别方案。
2.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,S3的方法还包括:
从淘汰的特征模板子集中随机抽取z个的特征模板,与较好的特征模板子集组合形成待测试特征模板集合。
3.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,S5的方法还包括:
从淘汰的特征模板子集中随机抽取z个的特征模板,与较好的特征模板子集组合形成新的待测试特征模板集合。
4.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,S3中,对匹配成功率的平均值xmean与最大值xmax求差值xd时,所得差值xd采用向上取整法,即当差值xd为非整数时,则将其小数位省略掉,整数位向上进“1”;
其计算公式为:
xd=RoundUp(xmax-xmean)。
5.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,S5中,所述Δx2<xa中,xa=xd/2。
6.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,S3中分类失败率n%的预设是根据工作环境的实际情况和需求进行预设的。
7.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,S1中选择特征模板是无需进行标记的。
8.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,S1中目标对象的基础数据包括文本、图像和音频。
9.如权利要求1所述的基于增强聚类的机器学习算法,其特征在于,所述特征模板的数量N为10-30。
10.一种基于增强聚类的机器学习算法的应用,其特征在于,所述基于增强聚类的机器学习算法可应用于工业产品图像的视觉识别、文本数据的数据分析或者音频文件的特征提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710359205.2/1.html,转载请声明来源钻瓜专利网。