[发明专利]一种基于信息变化率及条件互信息的特征变量选择方法有效
申请号: | 201911050233.1 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110942149B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 李琼芳;韩幸烨;刘振男;陈启慧;周正模;和鹏飞;曾天山 | 申请(专利权)人: | 河海大学;贵州理工学院 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 变化 条件 互信 特征 变量 选择 方法 | ||
1.一种基于信息变化率和条件互信息的特征变量选择方法,其特征在于:包括以下步骤:
(1)初始化阶段:获取待选特征变量数据集、模型输出目标,令F为待选因子初始集,S是用于存放最终入选因子的空集,c是输出因子;
(2)依次计算待选因子fi与输出因子c之间的互信息值;
(3)根据互信息值最大原则确定第一个入选因子;
(4)基于信息论提出信息变化率的概念;
(5)根据条件互信息和信息变化率确定其他入选因子,完成特征变量选择;
(6)将所提取的特征变量输入自适应神经模糊推理系统进行住宅价值的预测;
步骤(1)所述数据集共有506组数据、14个属性,用于模拟住宅周边情况与住宅价值的关系;其中,序号1~13的属性为每栋住宅周边的情况,序号14为住宅的价值,可以应用1~13的属性值对住宅的价值14进行预测;将序号1~13的住宅周边属性值作为待选输入因子表示为X1,X2,……,X13,将序号14住宅价值的属性值作为输出因子c;
所述步骤(4)包括以下步骤:
(41)提出的信息变化率的概念:F为待选因子集合,fi为待选因子,有fi∈F,i=1,2,···,n,S为入选因子集合,si为入选因子,有si∈S,c为输出量,则:
其中,λ表示的是在入选因子已知的前提下,待选因子fi入选后对输出量c的信息量与所有入选因子对输出量的信息量的比值,定量评价待选因子fi对输出量c的重要性或者贡献率;
(42)当入选因子集S中包含有2个及以上因子时,MI(c;fi|S)采用如下公式计算:MI(c;fi|S)≈MI(c;fi|f1)+[MI(fm;fi|c)-MI(fm;fi|f1)],其中,f1为首个入选因子,fi为当前待选因子,fm为上一轮入选因子;对多个因子的联合互信息MI(c;fi;S)计算采用k-近邻互信息计算方法,其中n为输入样本数目;
所述步骤(5)包括以下步骤:
(51)判定待选因子集F是否为空集,若F不为空集,则计算MI(fi;S;c)与MI(c;fi|S),S为入选因子集,并将MI(c;fi|S)按降序排列;其中,MI(c;fi|S)为待选因子fi入选后对输出量c的信息量;MI(fi;S;c)为待选因子、入选因子集合与输出量之间的互信息值;
(52)判断联合互信息值的变化情况:设定某一阈值参数ε,由MI(c;fi|S)最大的待选变量开始计算,若则表明fi的入选大幅度增加了联合互信息值,即fi对输出量信息贡献度较大;在此情况下,包含fi及之前的全部待选因子入选;其中参数ε取值的区间为[0.5,1],接下来从fi+1开始执行(53);否则,算法从第二个待选因子开始执行(53);
(53)对每个待选因子计算信息变化率λ,如果满足max(MI(c;fi|S),λ)>δ,则将入选变量fi移出待选因子集,加入已选因子集;其中δ为设定参数,表征待选因子对输出变量的贡献率,取值范围为[0,1];选出所有满足要求的待选变量因子,组成特征子集。
2.根据权利要求1所述的一种基于信息变化率和条件互信息的特征变量选择方法,其特征在于,所述步骤(2)通过以下公式实现:
其中,MI为互信息值,fi(i=1,2,···,n)表示待选变量集F中的第i个待选因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学;贵州理工学院,未经河海大学;贵州理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911050233.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置