[发明专利]一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法有效

专利信息
申请号: 202211131995.6 申请日: 2022-09-16
公开(公告)号: CN115588467B 公开(公告)日: 2023-05-09
发明(设计)人: 王培培;叶明全;黎青青;梅雅欣;周运锋;袁金龙 申请(专利权)人: 皖南医学院
主分类号: G16B40/00 分类号: G16B40/00;G06N3/006;G06N3/02
代理公司: 北京和信华成知识产权代理事务所(普通合伙) 11390 代理人: 罗哲
地址: 241000 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多层 感知 动脉瘤 破裂 关键 基因 筛选 方法
【说明书】:

发明公开了一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法,包括以下步骤:步骤S1、利用基于快速关联的过滤算法对颅内动脉瘤破裂的原始基因数据集进行初次特征选择得到候选基因子集和非候选基因子集,基于候选基因子集的模型分类准确度和基因重要性在非候选基因子集中向候选基因子集中进行关键基因的补充;步骤S2、利用基于多层感知机分类器封装式特征选择方法,引入粒子群搜索策略及建立动态适应度函数进行二次特征选择得到最优基因子集。本发明基于多层感知机的过滤‑封装式组合基因选择方法,由于采用快速关联的过滤算法过滤式基因选择法,能够快速去除冗余基因,可以显著降低后续基因子集筛选的计算复杂度。

技术领域

本发明涉及基因筛选技术领域,具体涉及一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法。

背景技术

测序技术的发展产生了大量的高维生物组学数据,从高维生物组学数据中提炼与研究疾病相关的关键基因信息一直是生物信息学领域的研究热点。生物组学数据常呈现高维小样本、冗余度高的特点。颅内动脉瘤破裂是导致蛛网膜下腔出血的主要原因,对颅内动脉瘤生物标志物的识别有利于揭示其特征与疾病的内在关联和病发机理。颅内动脉瘤生物组学数据同其他肿瘤数据一样,都存在着大量冗余,噪声和与分类目标无关的基因,并且在利用生物标志物进行的功能验证实验方面,生物标志物越多,实验所产生的时间成本和经济成本就越大,因此生物学家或者临床研究人员往往更倾向于选择特征个数较少的关键特征子集作为生物标志物。

机器学习中的特征选择和分类等技术是识别生物标志物重要的方法,可提取、筛选、识别出高维生物组学数据中蕴藏的重要信息。通过构建分类模型的性能来寻找最优特征集合,从而达到挖掘重要生物信息的目的,同时可协助生物学家或者临床研究人员判断基因表达与疾病之间的潜在机制。特征选择可以看作是机器学习在生物组学数据中的预处理步骤,在基因表达数据分析方面有着不可或缺的作用。

特征选择的目的是剔除完全不相关和噪声特征、弱相关且冗余特征,筛选出建模相关的弱相关且不冗余特征、强相关特征。通过特征选择得到的最优特征子集在理论上应该使建模运行时间更短、模型性能越高,并且特征选择后数据中特征值的数值没有发生变化。根据特征子集的评价方式不同,基因特征选择方法可分为过滤式(F ilter-BasedMethods)、封装式(Wrapper-Based Methods)、嵌入式(Embedded-Based Methods),以及近几年比较流行的混合式(Hybr id-Based Methods)和整合式(Ensemble-Based Methods)。过滤式特征子集选择方法与封装式、嵌入式方法的最大不同之处在于过滤式特征子集选择过程不依赖于分类学习算法,计算复杂度也比较低,因此适用于大多数学习算法,通常也作为高维数据的特征选择方法,但是它无法在某一学习算法上去的稳定而理想的学习性能。封装式是在特征子集选择过程中引入分类学习算法作为特征子集学习性能评估的一部分,而嵌入型则是将分类学习算法的模型构建和特征选择过程融为一体,因此封装式和嵌入式方法在处理高维数据时都会导致其计算效率低下。以上三种方法各有优缺点,研究人员通常将以上几种方法进行结合构成混合式特征选择方法,常见的混合方式是过滤式和封装式结合,以便在计算效率和分类性能之间达成互补。现有技术中的混合方式在第一阶段进行特征过滤方法按照某种特定规则筛选出一些特征,所以可能会遗漏一些对分类结果起重要作用的特征,而且在运用智能搜索算法进行第二阶段特征精选中固定适应度函数,难以适应各个迭代过程的动态变化过程以实现得到提高分类有效性和提高分类速率性的最优基因子集。

发明内容

本发明目的在于提供一种基于多层感知机的颅内动脉瘤破裂关键基因筛选方法,以解决现有技术中会遗漏一些对分类结果起重要作用的特征,难以适应各个迭代过程的动态变化过程以实现得到提高分类有效性和提高分类速率性的最优基因子集的技术问题。

为了解决上述技术问题,本发明具体提供下述技术方案:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皖南医学院,未经皖南医学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211131995.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top