[发明专利]基于US-ELM的基因芯片表达数据分析系统及方法有效
申请号: | 201710596384.1 | 申请日: | 2017-07-20 |
公开(公告)号: | CN107368707B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 王之琼;李艳丽;曲璐渲;汪新蕾;赵亚楠 | 申请(专利权)人: | 东北大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G06N3/00 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 张志伟 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 us elm 基因芯片 表达 数据 分析 系统 方法 | ||
1.一种基于US-ELM的基因芯片表达数据分析系统,其特征在于,包括:
基因预处理单元,用于对基因芯片进行预处理以获得适用于实验的数据格式,即基因表达数据矩阵;
差异基因筛选单元,基于基因表达数据矩阵寻找在基因芯片中不同个体或者是不同组织中表达发生明显变化的差异基因,获得差异表达基因矩阵;
聚类单元,用于对差异表达基因矩阵进行聚类分析,得到共表达基因序列;
富集分析单元,用于对共表达基因序列进行富集分析,得到关于基因所参与的多条通路,得出在数据上共表达基因序列的生物学功能解释;
所述基因预处理单元包括:
背景校正器,用于根据MAS方法将基因芯片分为16个网格区域,每个网格区域使用信号强度最低的2%的探针去计算背景值和噪声以获得初始基因数据矩阵;
标准化器,用于选择一个基因芯片作为参考芯片,将其他基因芯片和参考芯片的初始基因数据矩阵分别作为线性缩放方法的输入,依次进行线性回归分析,用回归直线对其他基因芯片的信号值做缩放,进而输出标准化矩阵;
汇总器,用于使用统计方法通过probeset的杂交信号计算出标准化矩阵的计算表达量,进而得到基因表达数据矩阵;
所述差异基因筛选单元包括:
初始种群建立器,用于将基因表达数据矩阵与遗传算法染色体结构之间建立联系,再根据基因与染色体的关系实现算法的编码和解码,建立初始种群;
适应度计算器,根据适应度函数计算初始种群中每个个体的适应度;
选择算子操作器,根据初始种群中个体的适应度,对个体进行优胜劣汰操作,筛选出适应度高的个体参与进化繁殖下一代;
交叉算子操作器,用于将经筛选后的不同个体的两个染色体的部分基因相互交换重组生成新的个体;
变异算子操作器,用于改变新的个体的染色体的某些基因值,进而产生新一代种群,保持种群多样性;
算法终止器,用于当种群不在变化或达到设定的迭代次数时,终止迭代过程,获得差异表达基因矩阵。
2.如权利要求1所述的基于US-ELM的基因芯片表达数据分析系统,其特征在于,所述聚类单元包括:
变换矩阵生成器,根据US-ELM原理,生成差异表达矩阵的拉普拉斯变换矩阵;
随机参数生成器,根据US-ELM原理,差异表达矩阵作为输入,设定隐层节点个数,随机生成输入节点的权重向量和隐层节点的阈值;
转换器,根据US-ELM原理,利用输入节点的权重向量和隐层节点的阈值生成差异表达矩阵的隐层输出矩阵;
降维器,根据US-ELM原理,根据拉普拉斯矩阵和隐层输出矩阵,得到降维后的差异表达矩阵;
聚类器,利用聚类算法对降维后的差异表达矩阵进行聚类,得到共表达基因序列。
3.如权利要求1所述的基于US-ELM的基因芯片表达数据分析系统,其特征在于,所述富集分析单元包括:
KEGG富集器,用于对共表达基因序列进行KEGG富集分析,得到关于基因所参与的多条通路;
GO富集器,用于对共表达基因序列进行GO富集分析,得出在数据上共表达基因的生物学功能解释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710596384.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有螺旋流道的光学镜面辊
- 下一篇:步进式开水器