[发明专利]基于logistic与相关信息熵的特征基因选择方法在审

专利信息
申请号: 201510057261.1 申请日: 2015-02-04
公开(公告)号: CN104598774A 公开(公告)日: 2015-05-06
发明(设计)人: 徐久成;李涛;孙林;孟慧丽;马媛媛;张倩倩;徐天贺;胡玉文;李晓艳;冯森 申请(专利权)人: 河南师范大学
主分类号: G06F19/22 分类号: G06F19/22
代理公司: 代理人:
地址: 453004 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于logistic与相关信息熵新的特征基因选择方法,包括以下步骤:对数据集进行logistic回归,获得对分类影响较大的基因变量,利用Relief算法对基因变量赋值并排序,向初始特征基因集合添加最大特征值基因,计算相关信息熵。本发明将机器学习中的logistic回归模型引入特征基因选择方法中,获得高质量的基因表达谱;利用相关信息熵度量基因变量之间的相关性,剔除冗余基因,通过搜索特征基因空间集获取分类能力较强且基因数目较少的特征基因子集。
搜索关键词: 基于 logistic 相关 信息 特征 基因 选择 方法
【主权项】:
一种基于logistic与相关信息熵的特征基因选择方法,其特征在于,其包括以下步骤:(1)通过logistic模型对乳腺癌数据集和胃癌数据集进行logistic逐步回归,得到特征子集ST1和ST2;(2)对特征子集ST1和ST2分别按照近似2∶1的比例分配到Strain和Stest;(3)初始化特征基因子集F和相关信息熵H;(4)利用Relief算法对特征基因赋权值,得到特征基因权值w={w1,w2,…,wn};(5)比较获得的特征基因权值与设定的阈值δ;(6)若特征基因gi的权值wi小于Relief阈值δ,将gi删除;(7)若特征基因gi的权值wi大于Relief阈值δ,将gi插入到特征集合F,转到步骤(5);(8)将F特征基因权值从大到小排序得到Fs,依次为Fs={g1,g2,…,gm};(9)再次初始化特征基因子集F;(10)将Fs权值最大的基因gi添加到特征基因子集F中,并计算其相关信息熵HR(FUgi);(11)判断加入该特征基因子集的相关信息熵是否变化;(12)如果相关信息熵减小,去掉该基因;(13)如果相关信息熵增大,将该基因加到特征基因子集F中,转到步骤(10);(14)返回特征子集F,算法结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南师范大学;,未经河南师范大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510057261.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top