[发明专利]一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法有效
申请号: | 202211131995.6 | 申请日: | 2022-09-16 |
公开(公告)号: | CN115588467B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 王培培;叶明全;黎青青;梅雅欣;周运锋;袁金龙 | 申请(专利权)人: | 皖南医学院 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G06N3/006;G06N3/02 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 罗哲 |
地址: | 241000 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 感知 动脉瘤 破裂 关键 基因 筛选 方法 | ||
1.一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法,其特征在于,包括以下步骤:
步骤S1、利用基于快速关联的过滤算法对颅内动脉瘤破裂的原始基因数据集进行初次特征选择得到表征分类相关性高且基因冗余性低的候选基因子集和非候选基因子集,基于候选基因子集的模型分类准确度和基因重要性在非候选基因子集中向候选基因子集中进行关键基因的补充,以避免过滤掉重要基因使得关键基因有机会进入最优基因子集;
步骤S2、利用基于多层感知机分类器封装式特征选择方法,引入粒子群搜索策略及建立动态适应度函数进行二次特征选择得到最优基因子集,以实现获取模型分类准确度的最优化表达的颅内动脉瘤破裂关键基因;
基于候选基因子集的模型分类准确度和基因重要性在非候选基因子集中向候选基因子集中进行关键基因的补充,包括:
步骤1、选取10组颅内动脉瘤破裂分类模型,利用10折交叉验证获取10组颅内动脉瘤破裂分类模型的平均分类准确度作为模型分类准确度,利用主成分分析法获取非候选基因的数据贡献度作为基因重要性,颅内动脉瘤破裂分类模型用于利用颅内动脉瘤破裂基因得到颅内动脉瘤破裂分类标签的;
步骤2、将基因重要性高于预设重要度的非候选基因组合为补充基因集;
步骤3、依次将补充基因集中各个非候选基因逐个补充至候选基因子集得到多个补充候选基因子集,计算出每个补充候选基因子集的模型分类准确度并保留最高模型分类准确度对应的补充候选基因子集作为最优候选基因子集,在补充基因集中删除补充至最优候选基因子集的非候选基因;
步骤4、重复步骤3,直至最优候选基因子集中候选基因数量固定于一定值不再增加;
利用主成分分析法获取非候选基因的数据贡献度,包括:
利用主成分分析法对原始基因数据集进行主成分分析得到原始基因数据集中各个基因的数据贡献度,并在原始基因数据集中各个基因的数据贡献度中查询出非候选基因的数据贡献度;
最优基因子集的获取,包括:
利用最优基因子集的基因数据总量和模型分类准确度构建出粒子群搜索策略的动态适应度函数,动态适应度函数的函数表达式为:
式中,F
以第
利用基于多层感知机分类器封装式特征选择方法,以动态适应度函数引入粒子群搜索策略对最优候选基因子集进行二次特征选择得到最优基因子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皖南医学院,未经皖南医学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211131995.6/1.html,转载请声明来源钻瓜专利网。