[发明专利]基于遗传算法的粗糙集属性约简方法无效
| 申请号: | 201010019400.9 | 申请日: | 2010-01-14 |
| 公开(公告)号: | CN101763529A | 公开(公告)日: | 2010-06-30 |
| 发明(设计)人: | 罗笑南;雷健;陈曦 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06N5/00 | 分类号: | G06N5/00;G06N3/12 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 510006 广东省广州市番禺*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 遗传 算法 粗糙 属性 方法 | ||
技术领域
本发明属于数据处理技术领域,具体涉及一种基于遗传算法的粗糙集属性约简方法。
背景技术
粗糙集理论是由波兰华沙理工大学Pawlak教授于20世纪80年代初提出的一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法,已经广泛在人工智能、知识与数据发现、模式识别与分类、不精确数据的分析推理等方面取得了较成功的应用。属性约简是粗糙集的核心内容之一,长期以来都是数据挖掘研究的重要课题。属性约简是指在保持系统分类或决策能力不变的情况下,删除其中不重要和冗余的属性;也就是可以用较少的属性获得与原来的属性库相同的分类或决策能力。遗传算法(GA)是模拟生物进化过程的计算模型,具有全局搜索、隐含并行性、鲁棒性、可扩展性等特点,已经被应用到粗糙集属性约简算法中,用于进行属性约简。
但是,现有的属性约简方法,存在着计算、搜索时间过长和过早收敛问题。
发明内容
本发明要解决的技术问题是克服现有的粗糙集属性约简方法的不足,提供一种基于遗传算法的粗糙集属性约简方法,能够提高运算速度,更快获取得到约简信息。
本发明提供一种基于遗传算法的粗糙集属性约简方法,包括如下步骤:
(1)求决策表的核,初始化随机产生初始群体;
(2)通过属性核限制初始群体对应其基因位,根据适应度函数计算适应值;
(3)采用修正算子对种群进行修复;
(4)判断是否满足算法终止条件,若是,输出最佳个体,若否,进入(5);
(5)在遗传算法中使用选择算子来对群体中的个体进行优胜劣汰操作;
(6)采用单点交叉的规则,以交叉概率对种群进行交叉操作;
(7)根据启发式变异算子,对种群进行变异操作,且属性核对应的基因位不发生变异。
优选的,所述算法终止条件为:如果当连续繁殖很多代的最优个体的适应值没有变化时,则循环结束。
优选的,所述在遗传算法中使用选择算子来对群体中的个体进行优胜劣汰操作包括:
对种群中的个体,按照其适应度在整个种群的个体适应度总和中所占的比例,采用轮盘赌方法进行选择;
采取最优个体保存方法构成新的群体。
优选的,所述进行交叉操作包括:以一定的概率选择个体参与交叉,对于参与交叉的两个父代个体随机选取交叉点,然后对交叉后的部分子串进行交换,产生下一代个体。
上述技术方案可以看出,由于本发明实施例将属性重要性作为启发式信息描述变异算子,引入启发式遗传算法,在初始群体中设置属性核设置,并修正个体的适应度值,提高了算法的收敛度,且算法的编码和适应度函数都很简单,因此能够快速且有效的求得最小约简。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明基于遗传算法的粗糙集属性约简方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供一种基于改进遗传算法的粗糙集属性约简方法,能够快速有效地获取决策表中属性的最小约简。以下分别进行详细说明。
本发明将属性重要性作为启发式信息描述变异算子,引入启发式遗传算法,在初始群体中添加属性,提出了一种改进启发式遗传算法的属性约简方法。
概括的说,包括以下步骤:随机产生初始群体,计算适应度值,修正个体,然后判断是不是最佳个体,如果是则输出最佳个体,否则执行遗传算法的选择操作、交叉操作、变异操作。
具体则如下描述:
在计算机输入信息系统S=(U,C∪D,V,f),其中U是对象的非空有限集合,C是条件属性集,D是决策属性集D;A是属性的非空有限集合,且A=C∪D,V表示全体属性的值域,Va表示属性a∈A的值域;f表示UXA→V的一个映射,称为信息函数。输出信息为A的最小约简,
也即:
获取的用户输入的信息:信息系统S=(U,C∪D,V,f);
需要输出的信息:属性集A的最小约简。
该方法执行以下操作:
(1)求决策表的核,初始化随机产生初始群体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010019400.9/2.html,转载请声明来源钻瓜专利网。





