[发明专利]一种关键特征的筛选方法在审
申请号: | 201611139357.3 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106778861A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 王会娜;黄伟;刘毅慧 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/12 |
代理公司: | 济南泉城专利商标事务所37218 | 代理人: | 刘丽 |
地址: | 250399 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键 特征 筛选 方法 | ||
1.一种关键特征的筛选方法,其特征在于将未选特征通过顺序选择找到关键特征组成特征子集。
2.根据权利要求1所述的筛选方法,其特征在于顺序选择为顺序前向选择或顺序后向选择,
(一)顺序前向选择实现步骤如下:
①将特征集合初始化为空集
②计算未选特征与已选特征子集之间的马氏距离,将马氏距离最大的特征gi记为Gk,设已选入k个特征,0≤k≤30,把未选入的30-k个特征逐个与已选入的特征Gk组合后计算J值,若J(Gk+g1)≥J(Gk+g2)≥…≥J(Gk+gn-k)则将g1加入候选特征子集;
③将新的特征gi加入集合G=G∪{gi},计算新的未选特征与已选特征子集之间的马氏距离;
④返回第二步直到没有符合添加条件的特征或达到规定的搜索条件结束;
(二)顺序后向选择实现步骤如下:
①将所有的特征作为初始集合G={g1,g2,…,gi},其中i=30;
②从未被剔除的特征集合中选择一个Mahalanobis距离最大的特征gi,假设已剔除r个特征,0≤r<30,剩下的特征组记为其中p=30-r,将中的各个特征gp(p=1,2,…,30-r)逐个剔除,并计算若:则这次循环中g1的马氏距离最大,剔除;
③将选择的特征gi从集合G中剔除,即G=G-{gi},计算剩下特征子集G的Mahalanobis距离;
④返回第二步直到没有符合剔除条件的特征或达到规定的搜索条件结束。
3.根据权利要求1或2所述的筛选方法,其特征在于将特征子集送入贝叶斯分类器。
4.根据权利要求3所述的筛选方法,其特征在于Mahalanobis距离公式为:
上述m代表特征个数,假设共有gi个特征,i=1,2,…,m其中m=30,共有30个特征,J(g)代表特征gi的Mahalanobis距离。
5.根据权利要求1或2所述的筛选方法,其特征在于步骤(1)中选好的特征子集分成训练集和测试集,然后将数据整理成贝叶斯分类器规定的格式,选取判别函数,将训练数据送入分类器进行训练,训练结束后用测试数据集进行分类测试,实验结果采用k折交叉验证。
6.根据权利要求5所述的筛选方法,其特征在于判别函数公式为:
d(x)=w1x1+w2x2+…wnxn
公式中n的取值是30,把x特征带入2个判别函数中比较,看哪个判别函数值大,就把x特征归为哪一类。
7.根据权利要求5所述的筛选方法,其特征在于所述k折交叉验证,是将总样本S分成k份不同的子集,每份样本个数为S/k,假如把第一份作为测试集,则其余份为训练集,以此类推k份中的每份都会作为测试集被调用一次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611139357.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于直方图匹配的图像定位方法
- 下一篇:一种信息分类方法及装置