[发明专利]一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法有效
申请号: | 202211131995.6 | 申请日: | 2022-09-16 |
公开(公告)号: | CN115588467B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 王培培;叶明全;黎青青;梅雅欣;周运锋;袁金龙 | 申请(专利权)人: | 皖南医学院 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G06N3/006;G06N3/02 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 罗哲 |
地址: | 241000 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 感知 动脉瘤 破裂 关键 基因 筛选 方法 | ||
本发明公开了一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法,包括以下步骤:步骤S1、利用基于快速关联的过滤算法对颅内动脉瘤破裂的原始基因数据集进行初次特征选择得到候选基因子集和非候选基因子集,基于候选基因子集的模型分类准确度和基因重要性在非候选基因子集中向候选基因子集中进行关键基因的补充;步骤S2、利用基于多层感知机分类器封装式特征选择方法,引入粒子群搜索策略及建立动态适应度函数进行二次特征选择得到最优基因子集。本发明基于多层感知机的过滤‑封装式组合基因选择方法,由于采用快速关联的过滤算法过滤式基因选择法,能够快速去除冗余基因,可以显著降低后续基因子集筛选的计算复杂度。
技术领域
本发明涉及基因筛选技术领域,具体涉及一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法。
背景技术
测序技术的发展产生了大量的高维生物组学数据,从高维生物组学数据中提炼与研究疾病相关的关键基因信息一直是生物信息学领域的研究热点。生物组学数据常呈现高维小样本、冗余度高的特点。颅内动脉瘤破裂是导致蛛网膜下腔出血的主要原因,对颅内动脉瘤生物标志物的识别有利于揭示其特征与疾病的内在关联和病发机理。颅内动脉瘤生物组学数据同其他肿瘤数据一样,都存在着大量冗余,噪声和与分类目标无关的基因,并且在利用生物标志物进行的功能验证实验方面,生物标志物越多,实验所产生的时间成本和经济成本就越大,因此生物学家或者临床研究人员往往更倾向于选择特征个数较少的关键特征子集作为生物标志物。
机器学习中的特征选择和分类等技术是识别生物标志物重要的方法,可提取、筛选、识别出高维生物组学数据中蕴藏的重要信息。通过构建分类模型的性能来寻找最优特征集合,从而达到挖掘重要生物信息的目的,同时可协助生物学家或者临床研究人员判断基因表达与疾病之间的潜在机制。特征选择可以看作是机器学习在生物组学数据中的预处理步骤,在基因表达数据分析方面有着不可或缺的作用。
特征选择的目的是剔除完全不相关和噪声特征、弱相关且冗余特征,筛选出建模相关的弱相关且不冗余特征、强相关特征。通过特征选择得到的最优特征子集在理论上应该使建模运行时间更短、模型性能越高,并且特征选择后数据中特征值的数值没有发生变化。根据特征子集的评价方式不同,基因特征选择方法可分为过滤式(F
发明内容
本发明目的在于提供一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法,以解决现有技术中会遗漏一些对分类结果起重要作用的特征,难以适应各个迭代过程的动态变化过程以实现得到提高分类有效性和提高分类速率性的最优基因子集的技术问题。
为了解决上述技术问题,本发明具体提供下述技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皖南医学院,未经皖南医学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211131995.6/2.html,转载请声明来源钻瓜专利网。