[发明专利]基于改进GA-SVM的肿瘤特征基因提取方法在审

专利信息
申请号: 201711081362.8 申请日: 2017-11-07
公开(公告)号: CN108664985A 公开(公告)日: 2018-10-16
发明(设计)人: 陈伟锋;郭明;应时彦;张贵军 申请(专利权)人: 浙江工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/12;G06N99/00
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 王兵;黄美娟
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基因提取 肿瘤特征 分类效果 基因特征 测试集 验证集 子集 改进 肿瘤基因表达 支持向量机 输入支持 数据降维 样本分类 肿瘤表达 向量机 训练集 分类
【权利要求书】:

1.基于改进GA-SVM的肿瘤特征基因提取方法,包括以下步骤:

步骤S1、将基因表达谱数据集进行支持向量机SVM进行样本选择,将样本分为:训练集、验证集和测试集;

步骤S2、将上述得到的测试集、验证集输入改进的GA-SVM进行数据降维处理,得到基因特征子集;

步骤S3、将上述得到的训练集、验证集基因特征子集以及对应的测试集基因特征子集进行支持向量机SVM进行分类分析。

2.如权利要求1的所述方法,其特征在于:所述步骤S1中采用支持向量机(SVM)进行样本选择,具体过程如下:

步骤S11、随机生成一个等概率0、1编码的标准化样本选择矩阵,行向量用于选择样本,1代表选中样本,0代表未选中,列向量维数代表进行SVM训练的次数;

步骤S12、在每次训练结束后,统计每个样本成为支持向量机的次数。

3.如权利要求1的所述方法,其特征在于:所述步骤S2中采用改进的GA-SVM,通过K-MEANS与SVM结合得到GA的适应度函数,即根据SVM所得分类误差与K-MEANS所得基因子集的类内类间的间距的大小评价基因子集的优劣,具体内容如下:

步骤S21、计算分类误差:由于实验数据样本太少,为提高可靠性,对训练集和测试集分别估计分类错误率;在训练集上,采用交叉验证法,每次保留一个子集作为测试用,其余样本用于SVM训练,得到分类错误个数E1;接着把验证集作为测试用,训练集用于SVM训练,得到分类错误个数E2

步骤S22、计算类内、类间间距:根据K-MEANS来计算类内类间间距,计算过程如下:

步骤S221、计算聚类中心:

其中,S+1为类标为+1的样本的聚类中心,S-1为类标为-1的样本的聚类中心;

步骤S222、计算类内、类间间距:

其中,d11,d22为类内间距,即+1(-1)样本到聚类中心S+1(S-1)的距离总和;d12,d21为类间间距,即-1(+1)样本到聚类中心S+1(S-1)的距离总和;s为聚类中心S+1与S-1之间的距离;a,b为待定参数;

步骤S23、遗传算法适应度函数:

f=E1+E2+dis。

4.如权利要求1的所述方法,其特征在于:所述步骤S2中采用改进的GA-SVM进行基因数据降维,得到基因特征子集,具体过程如下:

步骤S24、将步骤S1所得训练集和验证集,输入GA;

步骤S25、随机生成样本集,即等概率0、1编码的标准化基因矩阵,矩阵中行向量代表基因维数,列代表遗传算法种群大小;并指定遗传算法最大迭代次数200,交叉率0.85,变异率0.02;

步骤S26、将训练集、验证集数据代入K-MEANS/SVM中计算个体适应度。得出所有个体适应度后,使用轮盘赌的方法从当前种群中选择新种群;

步骤S27、对新种群进行交叉和变异操作;

步骤S28、一轮遗传迭代结束后,求出最佳个体,并与上一轮求得的最佳个体比较,较优个体留下,转到第2步,开始新一轮的GA;

步骤S29、达到GA设定迭代次数,则结束迭代;

步骤S210、直到最优适应度再无明显变化,再以最优适应度个体中包含的特征基因为研究对象重新构造新的特征空间,若满足终止条件则结束算法,得到最优特征基因子集;否则,依据所选取的新特征基因子集重复步骤S25~S210的操作。

5.如权利要求3的所述方法,其特征在于:所述步骤S24中的a,b为待定参数,具体确定过程:调节a,b的值,观察步骤S210所得满足终止条件的适应度值,当所得适应度值为最优适应度值时,该组a,b即为a,b的最终值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711081362.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top