本申请提供一种特征选择方法及装置,该方法通过响应接收到的训练样本集,生成第一训练样本集、与该第一训练样本集对应的第一特征索引集、第二训练样本集以及与该第二训练样本集对应的第二特征索引集,根据第一训练样本集计算第一元素,进而完成对第一特征索引集的更新,根据第二训练样本集计算第二元素,进而完成对第二特征索引集的更新,当更新后的第一特征索引集/第二特征索引集中各个特征的数量和满足预设值时,根据得到第一特征索引集以及第二特征索引集计算特征索引集,完成对特征的选择,以实现在特征选择的过程中,在保证学习效率的基础上,降低计算代缴、提高推广能力。
一种特征选择方法,其特征在于,包括:A、响应接收到的包括多个具有相同特征的训练样本的训练样本集,根据所述训练样本集中训练样本的类别,将所述训练样本集分成第一训练样本集以及第二训练样本集,并根据所述训练样本集中训练样本的特征,生成与所述第一训练样本集对应的第一特征索引集,以及与所述第二训练样本集对应的第二特征索引集;B、统计与所述训练样本集中单个训练样本对应的各个特征的数量和;C、计算与所述第一训练样本集对应的第一元素,以及与所述第二训练样本集对应的第二元素;D、将所述数量和减1;E、根据所述第一元素更新所述第一特征索引集,并根据所述第二元素更新所述第二特征索引集;F、当所述数量和满足预设值时,根据更新后的第一特征索引集以及第二特征索引集,计算特征索引集;其中,所述计算与所述第一训练样本集对应的第一元素,以及与所述第二训练样本集对应的第二元素,包括:计算与所述第一训练样本集对应的第一超球体,以及与所述第二训练样本集对应的第二超球体;计算与所述第一超球体对应的所有特征方向的能量,以及与所述第二超球体对应的所有特征方向的能量;根据计算得到的与该第一超球体对应的所有特征方向的能量,计算与所述第一训练样本集对应的第一元素,以及根据计算得到的与该第二超球体对应的所有特征方向的能量,计算与所述第二训练样本集对应的第二元素;所述根据更新后的第一特征索引集以及第二特征索引集,计算特征索引集,包括:计算更新后的第一特征索引集以及第二特征索引集的并集;获取更新后的第一特征索引集以及第二特征索引集的交集;剔除所述并集中与所述交集中的元素相同的元素,得到特征索引集。
本文链接:http://www.vipzhuanli.com/tech/sell/s_175410.html,转载请声明来源钻瓜专利网。