[发明专利]一种基于CUDA的属性约简方法有效

专利信息
申请号: 201810006829.0 申请日: 2018-01-04
公开(公告)号: CN108197656B 公开(公告)日: 2020-07-28
发明(设计)人: 李天瑞;胡云蒙;陈红梅;胡节 申请(专利权)人: 西南交通大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 成都盈信专利代理事务所(普通合伙) 51245 代理人: 崔建中
地址: 610031 四川省成都市高新*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于CUDA的属性约简方法,包括如下步骤:首先分析属性重要度评价函数的特点,将评价函数分解成可并行计算的评价子函数;其次结合CUDA编程模型,设计了多个CUDA kernel核函数,采用多线程的方式实现了条件属性划分和评价子函数的并行计算,通过并行规约的方法合并所有评价子函数得到属性重要度;最后利用内部属性重要度来选择不可或缺的属性,利用外部属性重要度来完成前向贪心搜索过程中最优属性的选择。本发明以数据并行的策略充分利用了GPU的计算资源,加快了属性约简的速度,提高了属性约简方法的效率。
搜索关键词: 一种 基于 cuda 属性 方法
【主权项】:
1.一种基于CUDA的属性约简方法,其特征在于,包括步骤1:去除数据集中含有缺失值的数据对象,离散化连续的属性,生成决策表S=(U,C∪D),其中U={x1,x2,…,xn}代表对象集,C={c1,c2,…,cm}代表条件属性集,D代表决策属性集,n为对象的数量,m为条件属性的数量;步骤2:计算U关于决策D的划分U/Ind(D)={D1,D2,...Dd},Ind(D)表示对象在决策属性集D上的不可分辨关系,fa(x)和fa(y)分别是对象x和对象y在决策属性a上的取值;将U/Ind(D)={D1,D2,...Dd}映射到决策布尔矩阵,生成n行d列的决策布尔矩阵Fn×d=(dij)n×d∈{0,1},其中步骤3:设定候选属性集计算B的条件布尔矩阵Ee×n,其中B={b1,b2,…bp}且p≤m;包括步骤3.1:分配GPU显存空间,将CPU端的决策表S=(U,C∪D)拷贝到GPU;步骤3.2:在GPU端采用CUDA的Thrust库,将对象集U={x1,x2,…,xn}按照B={b1,b2,…bp}的取值在GPU端并行排序,生成排序后的序列T={x1′,x2′,…,xn′}和排序后的对象标号L={l1,l2,…,ln},其中li∈{1,2,…n}表示xi′唯一的标识号;步骤3.3:在GPU端启动CUDA的kernel核函数,使用多线程并行扫描排序后的序列T,判断相邻对象是否在条件属性集B上满足不可分辨关系,生成T={x1′,x2′,…,xn′}关于B的布尔向量G={g1,g2,…,gn},其中其中fc(x)和fc(y)分别是对象x和对象y在条件属性c上的取值;步骤3.4:将布尔向量G={g1,g2,…,gn}和标号L={l1,l2,…,ln}从GPU端拷贝到CPU端;步骤3.5:在CPU端计算U关于条件属性集B的划分U/Ind(B)={E1,E2,…,Ee},生成关于条件属性集B的e行n列的条件布尔矩阵Ee×n=(eij)e×n∈{0,1},其中步骤4:计算条件属性集B的属性重要度评价函数Θ(D|B),包括步骤4.1:分配GPU显存空间,将条件布尔矩阵Ee×n和决策布尔矩阵Fn×d从CPU端拷贝到GPU端;在GPU端采用CUDA的cuSPARSE稀疏矩阵运算库,并行计算相交矩阵Ke×d=Ee×n×Fn×d=(kij)e×d,其中kij=|Ei∩Dj|,|·|表示集合的基数;步骤4.2:将属性重要度评价函数分解为的形式,在GPU端启动CUDA的kernel核函数,使用多线程并行计算每个评价子函数θ(sij),包括基于正域θPR(sij)、基于Shannon熵θSCE(sij)、基于互补熵θLCE(sij)和基于组合熵θCCE(sij)评价子函数,如下:其中Kij=Ei∩Dj|·|表示集合的基数,d表示决策属性的取值数量;步骤4.3:在GPU端启动CUDA的kernel核函数,使用多线程对所有的评价子函数θ(sij)进行并行求和操作,得到条件属性集B的属性重要度评价函数步骤5:初始化约简集CAttr=C,其中CAttr为中间局部变量;对任意的条件属性ci∈C,计算属性重要度评价函数Θ(D|C‑{ci});对任意的条件属性ci∈C,计算条件属性ci的内部属性重要度Siginner(ci,C,D);如果Siginner(ci,C,D)>0,则将条件属性ci添加到约简集Reduct中,并且从CAttr中删除条件属性ci,即Reduct=Reduct∪{ci},CAttr=CAttr‑{ci};步骤6:计算属性重要度评价函数Θ(D|Reduct),如果||Θ(D|Reduct)‑Θ(D|C)||<ε,则得到最终的约简集Reduct,否则继续;其中ε为预先设定的阈值;步骤7:对任意的条件属性ci∈CAttr,计算属性重要度评价函数Θ(D|Reduct∪{ci});对任意的条件属性ci∈CAttr,计算条件属性ci的外部属性重要度Sigouter(ci,Reduct,D);选择外部属性重要度最高的作为最优属性cj=argmax{Sigouter(ci,Reduct,D)};将最优属性cj添加到约简集Reduct中,并且从CAttr中删除最优属性cj对应的条件属性ci,即Reduct=Reduct∪{ci},CAttr=CAttr‑{ci},之后跳转到步骤6。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810006829.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top