[发明专利]基于最大相关最小冗余的快速封装式基因选择方法在审
申请号: | 201910810358.3 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110534155A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 杨静;沈安波;方宝富;王浩 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B40/00 |
代理公司: | 34101 安徽省合肥新安专利代理有限责任公司 | 代理人: | 陆丽莉;何梅生<国际申请>=<国际公布> |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于最大相关最小冗余的快速封装式基因选择方法,其步骤包括:1、利用相关性方法在基因向量组中寻找与类别标签具有最大相关度的基因,并将其加入候选基因子集;2、利用最大相关最小冗余方法在基因向量组中寻找具有最大相关冗余度的基因,并将其加入候选基因子集;3、利用十折交叉验证方法判断更新候选基因子集前后的两个候选基因子集的分类精度是否降低;4、若降低,则输出更新前的候选基因子集,否则重复步骤2。本发明能获得较高质量的基因子集,同时显著降低一般的封装方法的时间复杂度,从而使得在基因子集的获取上具有良好的时间性能,并使得获得的基因子集拥有较好的分类性能。 | ||
搜索关键词: | 候选基因 基因子集 子集 最大相关 基因 冗余 向量组 时间复杂度 最大相关度 分类性能 更新候选 基因选择 交叉验证 类别标签 封装式 冗余度 封装 输出 分类 重复 更新 | ||
【主权项】:
1.一种基于最大相关最小冗余的快速封装式基因选择方法,是应用于由n个微阵列基因数据组成的数据集Data中,记为Data={inst1,inst2,…,insti,…,instn};insti表示第i个微阵列基因数据;且 表示第i个微阵列基因数据insti中第j个基因;Ci表示第i个微阵列基因数据insti的类别变量,如癌症异常/正常;由n个微阵列基因数据的第j个基因组成数据集Data的第j个基因向量,记作 由m个基因向量构成数据集Data的基因向量组,记为F={f1,f2,...,fj,....,fm};n个微阵列基因数据的类别变量组成类别向量,记作C={C1,C2,...,Ci,...,Cn};从而获得由m个基因向量与一个类别向量所构成的基因向量数据集,记作D={f1,f2,...,fj,...,fm,C};1≤i≤n;1≤j≤m;其特征是,所述快速封装式基因选择方法是按照如下步骤进行:/n步骤1、定义候选基因子集S,并初始化 /n步骤2、根据基因向量组F与类别向量C,利用最大相关性方法依次计算并记录基因向量组F中的每个基因向量与类别向量C的相关度,记作相关度集合{I(f1;C),I(f2;C),…,I(fj;C),…,I(fm;C)};其中,I(fj;C)表示第j个基因向量与类别向量C的相关度;/n步骤3、定义循环值为k,并初始化k=1;/n步骤4、从所述相关度集合中寻找与类别向量C具有最大相关度的基因向量,并将相应的基因向量记作sk;/n步骤5、将基因向量sk加入到候选基因子集S中,从而获得第k次更新的候选基因子集Sk;并从基因向量组F中删除相应的基因向量sk,从而得到第k次删除后的基因向量组Fk;/n步骤6、利用最大相关最小冗余方法计算第k次删除后的基因向量组Fk中的每个基因向量与第k次更新的候选基因子集Sk中的每个基因向量关于类别向量C之间的相关冗余值,记作相关冗余值集合;/n步骤7、从所述相关冗余值集合中寻找与第k次更新的候选基因子集Sk中的每个基因向量关于类别向量C具有最大的相关冗余值的向量,并将相应的基因向量记作sk+1;/n步骤8、将基因向量sk+1加入到第k次更新的候选基因子集Sk中,从而获得第k+1次更新的候选基因子集Sk+1;并从第k次删除后的基因向量组Fk中删除相应的基因向量sk+1,从而得到第k+1次删除后的基因向量组Fk+1;/n步骤9、利用交叉验证方法判断第k次更新的候选基因子集Sk对类别向量C的分类精度相比于第k+1次更新的候选基因子集Sk+1是否降低;若降低,则表示完成基因选择,获得并输出第k次更新的候选基因子集Sk;否则,将k+1赋值给k后,并返回步骤6执行。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910810358.3/,转载请声明来源钻瓜专利网。