[发明专利]基于US-ELM的基因芯片表达数据分析系统及方法有效

专利信息
申请号: 201710596384.1 申请日: 2017-07-20
公开(公告)号: CN107368707B 公开(公告)日: 2020-07-10
发明(设计)人: 王之琼;李艳丽;曲璐渲;汪新蕾;赵亚楠 申请(专利权)人: 东北大学
主分类号: G16B30/10 分类号: G16B30/10;G16B40/00;G06N3/00
代理公司: 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 代理人: 张志伟
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 us elm 基因芯片 表达 数据 分析 系统 方法
【说明书】:

发明的基于US‑ELM的基因芯片表达数据分析系统及方法包括,基因预处理单元,用于对基因芯片进行预处理以获得适用于实验的数据格式;差异基因筛选单元,基于基因表达数据矩阵寻找在基因芯片中不同个体或者是不同组织中表达发生明显变化的差异基因,获得差异表达基因矩阵;聚类单元,用于对差异表达基因矩阵进行聚类分析,得到共表达基因序列;富集分析单元,用于对共表达基因序列进行富集分析,得到关于基因所参与的多条通路,得出在数据上共表达基因序列的生物学功能解释。本发明的分析系统及方法整体上提高了数据分析的准确性,差异基因处理过程筛选出更有效的明显表达差异基因,聚类处理中得出的类别在生物学解释上具有更多的相似性。

技术领域

本发明属于医学大数据挖掘技术领域,具体涉及基于US-ELM的基因芯片表达数据分析系统及方法。

背景技术

目前,基因芯片已经成为临床研究的重要研究方式,数据分析的结果直接影响着医生对疾病的诊断。目前基因芯片数据分析的相关研究有很多,主要集中在寻找差异表达基因/交集分析、数据降维、聚类分析和功能富集分析。然而,如何获得基因芯片原始数据并将其转化为各个实验目的所需数据形式成为了技术关键点。

在现有的针对基因数据分析算法的相关研究中,所处理的基因数据大多数来源于公开基因数据库,如GEO数据库。由于基因芯片数据样本量小、维度高的特点,基因数据的分析方法受到越来越多的关注。许多传统分析方法存在限制性,使得数据分析在规模以及效率上受到极大制约。

发明内容

本发明提供一种基于US-ELM的基因芯片表达数据分析系统及方法,采用的遗传法差异基因处理过程能筛选出更有效的明显表达差异基因,提高了数据分析的准确性。

本发明提供一种基于US-ELM的基因芯片表达数据分析系统,包括:

基因预处理单元,用于对基因芯片进行预处理以获得适用于实验的数据格式,即基因表达数据矩阵;

差异基因筛选单元,基于基因表达数据矩阵寻找在基因芯片中不同个体或者是不同组织中表达发生明显变化的差异基因,获得差异表达基因矩阵;

聚类单元,用于对差异表达基因矩阵进行聚类分析,得到共表达基因序列;

富集分析单元,用于对共表达基因序列进行富集分析,得到关于基因所参与的多条通路,得出在数据上共表达基因序列的生物学功能解释。

在本发明的基于US-ELM的基因芯片表达数据分析系统中,所述基因预处理单元包括:

背景校正器,用于根据MAS方法将基因芯片分为16个网格区域,每个网格区域使用信号强度最低的2%的探针去计算背景值和噪声以获得初始基因数据矩阵;

标准化器,用于选择一个基因芯片作为参考芯片,将其他基因芯片和参考芯片的初始基因数据矩阵分别作为线性缩放方法的输入,依次进行线性回归分析,用回归直线对其他基因芯片的信号值做缩放,进而输出标准化矩阵;

汇总器,用于使用统计方法通过probeset的杂交信号计算出标准化矩阵的计算表达量,进而得到基因表达数据矩阵。

在本发明的基于US-ELM的基因芯片表达数据分析系统中,所述差异基因筛选单元包括:

初始种群建立器,用于将基因表达数据矩阵与遗传算法染色体结构之间建立联系,再根据基因与染色体的关系实现算法的编码和解码,建立初始种群;

适应度计算器,根据适应度函数计算初始种群中每个个体的适应度;

选择算子操作器,根据初始种群中个体的适应度,对个体进行优胜劣汰操作,筛选出适应度高的个体参与进化繁殖下一代;

交叉算子操作器,用于将经筛选后的不同个体的两个染色体的部分基因相互交换重组生成新的个体;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710596384.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top